LLM 심사위원
사람 대신 대형 언어 모델(GPT-4 등)을 사용하여 다른 모델의 출력물이나 데이터의 품질을 평가하는 기법이다. 일관된 기준에 따라 대량의 데이터를 빠르게 채점할 수 있어 데이터 큐레이션 및 벤치마킹 자동화에 널리 활용된다.