플래시 어텐션
어텐션 연산의 메모리 접근 패턴을 최적화하여 속도를 높이고 메모리 사용량을 줄이는 알고리즘이다. 특히 긴 컨텍스트를 처리할 때 메모리 효율성을 극대화하는 데 필수적이다.