그래디언트 드리프트
학습 과정에서 가중치 업데이트 방향이 이전 태스크의 최적점에서 멀어지는 현상이다. 이 수치가 높을수록 이전 지식의 유실이 크다는 것을 의미하며, 본문에서는 이를 통해 망각 정도를 측정했다.