레이아웃 분석
문서 이미지 내에서 제목, 본문, 표, 그림 등 각 요소의 위치(Bounding Box)와 종류를 식별하고 읽기 순서를 결정하는 기술이다. 문서의 구조적 의미를 파악하여 마크다운이나 HTML 같은 구조화된 형식으로 변환하는 데 핵심적인 역할을 한다.