텐서 분할
모델의 연산을 여러 개의 GPU에 나누어 할당하는 방식이다. 각 GPU의 VRAM 용량 비율에 맞춰 가중치를 분배함으로써 단일 GPU 용량을 초과하는 모델을 병렬로 처리할 수 있게 한다.