워프 특화
GPU 내부의 실행 단위인 워프(Warp)들에게 서로 다른 역할을 부여하는 기법이다. 일부 워프는 데이터 로드만 담당하고, 다른 워프는 행렬 연산만 담당하게 하여 하드웨어 자원 활용도를 극대화한다. 이는 연산과 메모리 접근을 병렬화하여 병목 현상을 줄이는 데 핵심적이다.