전문가 혼합 모델
전체 파라미터 중 일부만 선택적으로 활성화하여 연산 효율을 높이는 신경망 구조이다. 특정 입력에 적합한 전문가 레이어만 작동하므로 모델 크기 대비 추론 속도가 매우 빠르다.