청크 단위 프리필
매우 긴 프롬프트를 한 번에 처리하지 않고 작은 단위(청크)로 나누어 처리하는 방식이다. 메모리 피크 부하를 방지하고 첫 번째 토큰이 나오기까지의 시간(TTFT)을 일정하게 유지하는 데 도움을 준다.