레드팀 테스트
시스템의 취약점을 발견하기 위해 의도적으로 공격자의 관점에서 보안 점검을 수행하는 방식이다. AI 분야에서는 모델이 부적절한 답변을 하거나 지침을 어기도록 유도하는 다양한 공격 시나리오를 테스트한다. 이를 통해 실제 운영 환경에서 발생할 수 있는 보안 사고를 사전에 예방하고 가드레일을 강화할 수 있다.