짧은 슬라이딩 윈도우 어텐션
시퀀스 내에서 현재 토큰과 인접한 일정 범위의 토큰들만 참조하는 어텐션 방식이다. 연산 복잡도를 줄이면서도 국소적인 문맥 정보를 효과적으로 통합할 수 있어 효율적이며, 하드웨어 가속기에 최적화된 연산 구조를 가진다.