체크포인팅
모델 학습 과정 중 특정 시점의 가중치와 상태를 저장하는 작업이다. 학습 중단 시 마지막 저장 지점부터 재개할 수 있게 해주며, 저장 시 일시적으로 GPU 연산이 멈추고 I/O 작업이 발생하여 유휴 상태로 오인될 수 있다.