기계론적 해석 가능성
AI 모델을 블랙박스로 보지 않고 개별 뉴런이나 회로 수준에서 그 작동 메커니즘을 역공학하여 이해하려는 연구 분야이다. 모델의 안전성과 신뢰성을 확보하기 위한 핵심 기술로 평가받는다.