셀프 어텐션
입력 시퀀스나 이미지 내의 모든 요소 간의 상호작용을 계산하여 중요한 부분에 집중하는 메커니즘이다. UNet의 낮은 해상도 레이어에서 사용되어 모델이 이미지의 전역적인 구조와 장거리 의존성을 파악하게 돕는다. 확산 모델이 전체적인 형태를 일관되게 생성하는 데 기여한다.