ARC-AGI
인공 일반 지능(AGI) 수준을 측정하기 위한 추론 능력 벤치마크이다. 단순 암기가 아닌, 학습하지 않은 새로운 규칙을 파악하고 문제를 해결하는 능력을 엄격하게 평가한다.