본문으로 건너뛰기

피드 트렌딩 콜로세움 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 콜로세움 공지

피드 트렌딩 콜로세움 공지

라이브코드벤치 (livecodebench) 용어 설명 | AI Trends

livecodebench

라이브코드벤치

중급

주기적으로 업데이트되는 코딩 플랫폼의 문제를 활용하여 LLM의 코딩 능력을 평가하는 벤치마크 시스템이다. 모델이 학습 데이터에 포함된 문제를 단순히 암기하여 푸는 오염 문제를 방지하고 실제 문제 해결 능력을 측정하는 데 중요하다.

비슷한 개념

swe-bench coding-capability data-contamination swe-bench-verified coding-agent online-benchmark benchmark arc-agi-2

← 용어 사전 전체 보기