픽셀 공간 디퓨전
이미지를 잠재 공간(Latent Space)으로 압축하지 않고 원본 픽셀 데이터에서 직접 노이즈를 제거하며 생성하는 방식이다. 토크나이저의 압축 손실 없이 미세한 질감과 구조를 보존할 수 있으나, 데이터 차원이 높아 학습 비용이 크다는 특징이 있다.