픽셀 공간 디퓨전(pixel-space-diffusion)이란 무엇인가요?

Question

Accepted Answer

이미지를 잠재 공간(Latent Space)으로 압축하지 않고 원본 픽셀 데이터에서 직접 노이즈를 제거하며 생성하는 방식이다. 토크나이저의 압축 손실 없이 미세한 질감과 구조를 보존할 수 있으나, 데이터 차원이 높아 학습 비용이 크다는 특징이 있다.

pixel-space-diffusion