멀티헤드 어텐션
입력 시퀀스의 여러 부분에 동시에 주의를 기울여 다양한 문맥적 관계를 독립적으로 학습하는 기법이다. 단일 어텐션보다 풍부한 정보를 포착할 수 있게 하며, 모델이 문장의 구조와 의미를 다각도에서 이해하도록 돕는 핵심적인 역할을 수행한다.