탈옥
AI 모델에 설정된 안전 가이드라인이나 제약 사항을 우회하여 금지된 답변을 이끌어내는 기법이다. 이번 사건에서는 스페인어 프롬프트를 사용하여 클로드의 보안 필터를 무력화했다. 이는 모델의 취약점을 노출시켜 악의적인 목적으로 사용될 위험이 크다.