추론 슬롯
서버가 동시에 처리할 수 있는 개별 추론 작업의 단위이다. 각 슬롯은 독립적인 컨텍스트를 가지며, 슬롯이 가득 차면 새로운 요청을 처리할 수 없으므로 효율적인 관리가 필수적이다.