텐서 병렬 처리
하나의 대형 모델 가중치를 여러 GPU에 나누어 저장하고 병렬로 계산하는 기법이다. 이를 통해 단일 GPU 메모리를 초과하는 대형 모델을 실행하거나 추론 속도를 획기적으로 높일 수 있어 대규모 인프라에 필수적이다.