PDF 파싱
비정형 데이터인 PDF 파일에서 텍스트, 표, 이미지 등의 정보를 구조화된 데이터로 추출하는 과정이다. 문서의 레이아웃을 정확히 해석해야만 LLM이 문맥을 오해하지 않고 정확한 정보를 처리할 수 있다.