구조화된 데이터 추출
비정형 문서(PDF, 이미지 등)에서 특정 필드(날짜, 금액, 이름 등)를 정해진 형식(CSV, JSON 등)으로 뽑아내는 기술이다. 단순 텍스트 읽기를 넘어 문서의 맥락과 구조를 이해해야 하며, 데이터베이스 입력이나 자동화 워크플로의 기초가 된다.