확장된 장단기 메모리
기존 LSTM에 지수적 게이팅과 행렬 구조의 메모리를 도입하여 Transformer처럼 병렬 학습이 가능하도록 개선한 아키텍처이다. 시퀀스 길이에 따라 연산량이 선형적으로 증가하여 긴 문맥 처리에 효율적이며, Transformer의 강력한 대안으로 주목받고 있다.