경험 재생
강화학습 과정에서 발생한 과거의 경험(데이터)을 버리지 않고 버퍼에 저장해 두었다가 나중에 다시 꺼내어 학습에 사용하는 기법이다. 데이터 간의 상관관계를 줄이고 과거에 배운 내용을 잊어버리는 망각 현상을 방지하여 학습의 안정성을 크게 높여준다.