시맨틱 임베딩
텍스트나 코드의 의미적 특징을 고차원 벡터 공간으로 투영하는 기술이다. 이를 통해 두 프로그램이 겉모양은 달라도 기능적으로 얼마나 유사한지를 수학적 거리로 계산할 수 있어, 중복된 후보를 걸러내는 데 필수적이다.