추론 워크로드
학습된 AI 모델을 실제 서비스에 적용하여 결과를 도출하는 과정에서 발생하는 연산 부하를 의미한다. 최근 AI 산업이 모델 개발을 넘어 실제 서비스 상용화 단계로 진입함에 따라 학습보다 추론 효율성이 인프라 구축의 핵심 지표가 되고 있다.