분할 추론
하나의 딥러닝 모델을 여러 부분으로 나누어 서로 다른 장치(예: 로컬 기기와 클라우드 서버)에서 실행하는 기법이다. 데이터의 일부만 전송하여 프라이버시를 보호하거나 로컬 기기의 연산 부담을 줄이는 데 사용된다.