업샘플링
데이터셋에서 비중이 적은 특정 클래스의 샘플을 복제하거나 늘려 전체 데이터의 균형을 맞추는 기법이다. 다국어 학습 시 데이터가 부족한 언어의 학습 기회를 보장하여 성능 저하를 방지하는 역할을 한다.