파이프라인 병렬화
모델의 레이어들을 여러 그룹으로 나누어 각 GPU가 순차적으로 처리하게 하는 방식이다. 텐서 병렬화에 비해 GPU 간 통신량이 적어 PCIe로 연결된 다중 GPU 환경에서 성능 최적화에 유리하다.