소프트 아그맥스
확률 분포에서 가장 높은 확률을 가진 인덱스를 단순히 선택하는 대신, 모든 인덱스에 확률값을 가중치로 곱해 합산하는 연산이다. 불연속적인 선택을 연속적인 수치로 변환하여 미분 가능한 학습을 가능하게 한다.