부분 관측 가능 마르코프 결정 과정
환경의 전체 상태를 직접 알 수 없을 때, 관측 가능한 정보를 바탕으로 최적의 행동을 결정하는 수학적 모델이다. 이 논문에서는 데이터베이스의 전체 구조를 모르는 상태에서 도구 호출 결과를 통해 구조를 파악해 나가는 과정을 모델링하는 데 사용됐다.