선형 어텐션
표준 Softmax Attention의 이차 복잡도(N²)를 선형 복잡도(N)로 줄이는 기법이다. 커널 함수를 이용해 쿼리와 키의 행렬 곱셈 순서를 변경함으로써 긴 시퀀스에서도 메모리와 연산 효율성을 극대화한다.