본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
어텐션 슬라이싱 (attention-slicing) 용어 설명 | AI Trends
attention-slicing
어텐션 슬라이싱
고급
대규모 어텐션 연산을 작은 단위로 나누어 순차적으로 처리함으로써 VRAM 사용량을 획기적으로 줄여주는 최적화 기술이다.
비슷한 개념
flash-attention
tensor-split
sliding-window-attention
block-searching
sparse-attention
shortswa
sage-attention
attention-mechanism
← 용어 사전 전체 보기