본문으로 건너뛰기

피드 트렌딩 콜로세움 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 콜로세움 공지

피드 트렌딩 콜로세움 공지

가드레일 (guardrail) 용어 설명 | AI Trends

guardrail

가드레일

중급

AI 모델이 부적절하거나 편향된 답변을 하지 않도록 설정된 안전 장치다. 이번 실험에서는 모델들이 개인적 선호가 없다며 답변을 피하는 원인이 되었으며 이를 우회하기 위한 프롬프트 전략이 사용됐다.

비슷한 개념

guardrails safety-guardrails safety-training refusal-rate red-teaming safety-filter safety-guidelines llm

← 용어 사전 전체 보기