반정밀도 부동소수점
데이터를 16비트로 표현하여 연산 속도를 높이고 메모리 사용량을 절반으로 줄이는 기법이다. 최신 GPU에서는 FP16 연산 전용 코어를 통해 정확도 손실을 최소화하면서도 추론 성능을 크게 향상시킬 수 있다.