분포 수축
넓게 퍼져 있는 확률 분포를 특정 고가치 영역으로 좁히는 과정이다. 이 논문에서는 강화학습을 통해 로봇의 다양한 가능성 있는 동작 중 성공 확률이 높은 동작으로 확률 밀도를 집중시키는 것을 의미한다.