퓨즈드 커널
여러 개의 연산 과정을 하나의 GPU 실행 단위로 합쳐 메모리 읽기/쓰기 횟수를 줄이는 최적화 기법이다. 연산 속도를 높이고 메모리 대역폭 병목 현상을 해결하는 데 필수적이다.