초당 토큰 수
AI 모델이 텍스트를 생성하는 속도를 측정하는 단위로, 하드웨어의 연산 능력과 메모리 대역폭에 따라 결정된다. 사용자 경험에서 응답의 실시간성을 판단하는 기준이 되며 하드웨어 성능 비교의 핵심이다.