라이브코드벤치
주기적으로 업데이트되는 코딩 플랫폼의 문제를 활용하여 LLM의 코딩 능력을 평가하는 벤치마크 시스템이다. 모델이 학습 데이터에 포함된 문제를 단순히 암기하여 푸는 오염 문제를 방지하고 실제 문제 해결 능력을 측정하는 데 중요하다.