자원 제약
모델 실행에 필요한 GPU, 메모리 등의 하드웨어 자원 제한을 의미한다. 운영 비용 절감을 위해 자원을 축소할 경우 모델이 복잡한 추론 대신 단순한 패턴의 답변을 내놓는 성능 저하가 발생할 수 있다.