메모리 대역폭
메모리에서 프로세서로 데이터를 전달하는 속도를 의미한다. AI 추론 시 모델의 파라미터를 메모리에서 읽어오는 과정이 병목 현상을 일으키기 때문에, 연산 능력(FLOPS)보다 대역폭이 모델의 실제 구동 속도를 결정하는 더 중요한 요소가 된다.