토큰 효율성
LLM이 처리하는 최소 단위인 토큰의 사용량을 최적화하는 기법이다. 불필요한 프로토콜 오버헤드를 줄여 컨텍스트 윈도우를 아끼고, 에이전트가 더 긴 시간 동안 일관된 작업을 수행하도록 돕는 것이 핵심이다.