본문으로 건너뛰기

피드 트렌딩 콜로세움 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 콜로세움 공지

피드 트렌딩 콜로세움 공지

탈옥 (jailbreaking) 용어 설명 | AI Trends

jailbreaking

탈옥

중급

AI 모델에 설정된 안전 가이드라인이나 제약 사항을 우회하여 금지된 답변을 이끌어내는 기법이다. 이번 사건에서는 스페인어 프롬프트를 사용하여 클로드의 보안 필터를 무력화했다. 이는 모델의 취약점을 노출시켜 악의적인 목적으로 사용될 위험이 크다.

비슷한 개념

jailbreak safety-protocol prompt-injection safety-guidelines instruction-injection safety-guardrails guardrail safety-filter

← 용어 사전 전체 보기