롱테일 분포
어텐션 점수 중 극소수만이 높은 값을 가지고 대다수는 매우 낮은 값을 가지는 통계적 특성입니다. 이 꼬리 부분을 효과적으로 제거하면 모델 성능 저하 없이 연산량을 대폭 줄일 수 있습니다.