중요도 샘플링
서로 다른 확률 분포에서 수집된 데이터를 현재 분포에 맞게 보정하여 기댓값을 계산하는 통계적 기법이다. 강화학습에서는 과거 데이터로 현재 모델을 업데이트할 때 발생하는 오차를 줄이는 데 필수적이다.