ARC-AGI-2 벤치마크
인간의 추상적 추론 능력을 모방하여 AI의 일반 지능(AGI) 수준을 측정하는 벤치마크이다. 기존 언어 모델의 암기력을 배제하고 새로운 규칙을 학습하는 능력을 평가하는 데 중점을 둔다.