AI/ML 핵심 용어를 한국어로 쉽게 설명합니다. LLM, RAG, 파인튜닝, 에이전트 등 주요 개념을 확인하세요.
verifier
검증기
LLM이 생성한 중간 결과물이나 최종 출력이 특정 규칙(구문, 단위 테스트 등)을 만족하는지 확인하는 모듈이다. 워크플로를 수정하거나 중단하는 중요한 피드백 신호를 제공하여 에이전트의 신뢰성을 높인다.
agent-tool
에이전트 도구
거대언어모델(LLM) 기반 에이전트가 외부 세계와 상호작용하기 위해 사용하는 인터페이스나 함수이다. 모델은 프롬프트만으로 해결할 수 없는 계산, 검색, 파일 조작 등의 작업을 도구 호출을 통해 외부 프로그램에 위임한다. 이는 정적인 모델에 동적인 실행 능력을 부여하는 핵심 요소이다.
proactive-agent
능동형 에이전트
사용자의 명시적인 명령이 떨어지기 전에 현재 상황과 맥락을 분석하여 필요한 작업을 예측하고 먼저 제안하거나 실행하는 지능형 시스템이다. 연속적인 데이터 흐름 속에서 사용자의 잠재적 의도를 파악하는 능력이 핵심이며, 사용자 경험을 선제적으로 개선한다.
proactive-interaction
선제적 상호작용
사용자의 명시적인 명령이 없어도 AI가 주변 상황을 스스로 판단하여 먼저 알림을 주거나 행동을 제안하는 방식이다. 수동적인 반응형 AI를 넘어 능동적인 비서 역할을 수행하기 위한 핵심 기능이다.
computer-use-agent
컴퓨터 사용 에이전트
인간처럼 컴퓨터 화면을 보고 마우스와 키보드를 조작하여 복잡한 작업을 수행하는 AI 에이전트이다. 단순한 API 호출이 아닌 시각적 요소를 직접 인식하고 제어한다는 점이 특징이다.
evaluator-optimizer
평가자-최적화 루프
생성 모델이 내놓은 결과물을 검증 모델이 평가하고 피드백을 제공하여 다시 생성하게 하는 반복 루프 구조이다. 코드 작성이나 정밀한 텍스트 생성처럼 결과물의 품질이 중요한 작업에서 성능을 극대화하는 데 사용된다.
tool-orchestration
도구 오케스트레이션
에이전트가 복잡한 목표를 달성하기 위해 여러 외부 도구를 적절한 순서와 방법으로 선택, 호출, 실행하는 관리 과정입니다. 효율적인 오케스트레이션은 에이전트의 작업 성공률과 실행 안정성을 결정짓는 핵심 요소입니다.
multi-agent-reasoning
다중 에이전트 추론
여러 독립적인 주체가 동시에 상호작용하는 환경에서 각 주체의 의도와 행동을 분리하고 그 관계를 파악하는 고차원적 인지 과정이다.
sub-agent-orchestration
하위 에이전트 오케스트레이션
하나의 메인 에이전트가 복잡한 작업을 분할하여 여러 하위 에이전트에게 할당하고 관리하는 구조이다. 병렬 실행을 통해 개발 속도를 높이고 각 에이전트의 전문성을 활용하는 방식이다.
gui-agent
GUI 에이전트
그래픽 사용자 인터페이스를 통해 컴퓨터나 모바일 기기를 조작하고 작업을 수행하는 AI 시스템이다. 화면의 시각적 정보를 해석하여 클릭이나 입력 등의 행동을 실행하며, 주로 사용자의 명시적인 명령에 따라 특정 태스크를 완료하는 역할을 수행한다.
prenorm
프리노름
레이어의 연산 전에 정규화를 수행하는 방식으로 현대 LLM의 표준 구조이다. 학습 안정성은 높지만 깊이가 깊어질수록 초기 층의 기여도가 상대적으로 낮아지는 '희석(Dilution)' 문제가 발생한다.
hypergraph-neural-network
하이퍼그래프 신경망
하나의 에지가 두 개 이상의 노드를 동시에 연결할 수 있는 하이퍼그래프 구조를 활용한 신경망이다. 단순한 쌍별 관계를 넘어 여러 데이터 요소 간의 복잡하고 고차원적인 상호작용을 모델링하는 데 탁월하다.
hamiltonian-neural-network
해밀토니안 신경망
물리 법칙인 해밀토니안 역학을 신경망 구조에 내장하여 에너지 보존 법칙 등을 준수하며 학습하는 모델이다. 시스템의 물리적 동역학을 정확하게 모델링할 수 있어 NIMCP가 환경의 물리적 특성을 더 깊이 이해하도록 돕는다.
mixture-of-transformers
트랜스포머 혼합 구조
공통된 백본 네트워크 위에 특정 작업(행동, 언어 등)에 특화된 전문가 모듈을 결합한 아키텍처이다. 하나의 모델로 여러 종류의 출력을 효율적으로 생성할 수 있다.
native-app
네이티브 앱
iOS나 Android와 같은 특정 모바일 운영체제 전용 언어로 제작된 애플리케이션이다. 웹 앱보다 기기 성능을 더 잘 활용하며 앱스토어를 통한 배포와 수익화에 필수적이다.
multimodal-integration
멀티모달 통합
텍스트, 이미지, 수치 데이터 등 서로 다른 형태의 정보를 결합하여 하나의 모델이나 시스템에서 처리하는 기술이다. 현실 세계의 복잡한 문제를 해결하기 위해 다양한 감각 정보를 융합하는 것과 유사한 원리로 작동한다.
spatial-temporal-reasoning
시공간적 추론
공간상의 객체 위치와 시간의 흐름에 따른 변화를 동시에 파악하여 논리적 결론을 도출하는 능력이다. 비디오 이해에서 객체의 움직임과 사건의 인과 관계를 분석하는 핵심 요소이다.
in-memory-engine
인메모리 엔진
모든 데이터를 디스크가 아닌 RAM에 유지하여 처리하는 시스템이다. 디스크 I/O 병목 현상을 제거하여 데이터 접근 속도를 비약적으로 향상시키며 실시간 대규모 쿼리 처리에 최적화된 구조를 가진다.
protocol-contract
프로토콜 계약
추출된 정책 규칙들을 시스템이 실행하고 강제할 수 있는 형태의 규약으로 컴파일한 결과물이다. LLM 출력이 외부로 나가기 전 통과해야 하는 기술적 관문 역할을 한다.
snn
스파이킹 신경망
생물학적 뉴런이 전기적 스파이크 신호를 주고받는 방식을 모방한 신경망 구조이다. 시간적 정보를 효율적으로 처리하며, NIMCP에서는 포유류 대뇌 피질과 유사한 26Hz의 발화율을 기록하는 등 높은 에너지 효율과 생물학적 유사성을 달성하는 데 핵심적인 역할을 한다.
gaussian-splatting
가우시안 스플래팅
3D 장면을 수많은 가우시안 타원체들의 집합으로 표현하여 실시간으로 고화질 렌더링을 수행하는 기법이다. 기존 NeRF보다 속도가 빠르고 명시적인 기하학적 최적화가 가능하다.
spatio-temporal-decoupling
시공간적 디커플링
비디오 데이터의 공간적 정보와 시간적 정보를 분리하여 처리하는 기법이다. 이를 통해 모델이 비디오 전체를 다시 학습하지 않고도 특정 프레임의 스타일이나 객체만 독립적으로 수정할 수 있게 한다.
sliding-window-attention
슬라이딩 윈도우 어텐션
전체 시퀀스 대신 고정된 크기의 윈도우 내 토큰들만 참조하여 연산량을 줄이는 기법이다. 메모리 효율성을 극대화하여 이론적으로 무제한에 가까운 긴 오디오 스트림을 처리할 수 있게 한다.
triplet-gcn
트리플렛 그래프 컨볼루션 네트워크
그래프 내의 노드, 에지, 그리고 전역 정보를 동시에 고려하여 메시지를 전달하는 신경망 구조이다. 객체 간의 복잡한 관계를 다차원적으로 분석하여, 특정 가구의 변화가 주변 가구의 배치나 스타일에 미치는 영향을 정교하게 계산할 수 있다.
steiner-tree-problem
스테이너 트리 문제
그래프 내의 특정 정점 집합(터미널)을 모두 연결하는 최소 비용의 부분 트리를 찾는 조합 최적화 문제이다. 이 논문에서는 쿼리의 핵심 개념들을 연결하는 최적의 부분 그래프를 찾는 문제로 변형하여 사용한다.
prm
프로세스 보상 모델
모델이 최종 결과뿐만 아니라 중간 추론 단계마다 점수를 부여하는 방식이다. 각 단계의 논리적 타당성을 평가하여 복잡한 문제 해결 과정의 정확도를 높이는 데 기여한다.
agentic-computation-graph
에이전트 계산 그래프
LLM 에이전트의 작업 흐름을 노드(연산)와 엣지(데이터/제어 흐름)로 구성된 그래프로 표현한 추상화 모델이다. 에이전트의 복잡한 동작을 정형화하여 최적화 대상으로 다룰 수 있게 한다.
agentic-pipeline
에이전트 기반 파이프라인
복잡한 작업을 여러 단계로 나누고, 각 단계에서 AI가 도구 사용, 추론, 자기 수정을 자율적으로 수행하도록 설계된 시스템 구조이다. 단일 모델 호출보다 높은 정확도와 복잡한 워크플로 처리가 가능하다.
spline-based-distortion-model
스플라인 기반 왜곡 모델
렌즈 왜곡을 표현하기 위해 다항식 대신 스플라인 곡선을 사용하는 방식이다. OpenCV에서 흔히 쓰이는 다항식 모델은 왜곡이 심한 광각이나 어안 렌즈에서 오차가 발생하기 쉬우나, 스플라인 모델은 국부적인 변화에 유연하게 대응하여 더 정밀한 보정이 가능하다.
context-window-limit
컨텍스트 창 제한
LLM이 한 번에 처리하고 기억할 수 있는 토큰 양의 한계를 의미한다. 장기적인 작업 시 이전 대화 내용을 잊어버리는 문제를 해결하기 위해 AutoResearch는 기억을 모델 내부가 아닌 외부 파일이나 Git 기록에 저장하는 방식을 채택했다.
digital-twin
디지털 트윈
물리적 객체나 시스템을 디지털 공간에 그대로 복제하여 실시간 데이터를 동기화하고 시뮬레이션하는 기술이다. 센서 데이터를 통해 가상 모델을 업데이트하며 실제 시스템의 동작을 예측하고 최적화하는 데 사용된다. 제조 현장에서 리스크 없이 공정 변경을 테스트할 수 있게 해준다.
recursive-loop
재귀적 루프
출력된 결과가 다시 입력으로 돌아가 다음 사고 과정에 영향을 미치는 순환 구조이다. 이 과정에서 사고와 표현이 분리되지 않고 실시간으로 상호작용하며 새로운 인지 상태를 형성하는 토대가 된다.
routing-system
라우팅 시스템
사용자의 요청을 분석하여 가장 적합한 처리 주체(에이전트)에게 전달하는 메커니즘이다. Naksha는 디자인 요청의 성격에 따라 26개의 전문 역할 중 최적의 에이전트를 선택한다.
liquid-neural-network
리퀴드 신경망
미분 방정식을 사용하여 시간에 따라 변화하는 연속적인 데이터를 처리하는 신경망이다. 학습이 끝난 후에도 파라미터가 입력 데이터에 따라 유연하게 적응하는 특성이 있어, NIMCP의 다중 신경망 통합 구조에서 동적인 환경 적응력을 높이는 데 기여한다.
semantic-centroid
시맨틱 중심점
세션 내에서 발생한 여러 행동 벡터들의 평균적인 위치를 나타내는 개념이다. 에이전트의 전반적인 행동 프로필을 하나의 벡터로 압축한 것이며, 새로운 행동이 기존 맥락과 일치하는지 판단하는 기준점이 된다.
heterogeneous-graph
이질적 그래프
메시지, 토픽, 사실, 페르소나 등 서로 다른 유형의 노드와 이들 사이의 다양한 관계(엣지)를 포함하는 그래프 구조로, 복잡한 데이터 간의 다각적 연결성을 표현함.
recursive-dependency
재귀적 의존성
시스템의 현재 상태가 이전 상태에 직접적으로 의존하며 연속적으로 이어지는 성질이다. 생물학적 신경 활동은 이러한 재귀적 구조를 통해 정보를 지속적으로 업데이트하며, 이는 AI의 이산적인 상태 생성 방식과 대비되는 핵심적 차이다.
transient-activation
휘발성 활성화
모델이 추론을 수행하는 동안 생성되는 고차원적인 내부 연산 상태가 결과 도출 직후 사라지는 현상이다. 이로 인해 시스템은 이전의 연산 맥락을 데이터로서 참조할 수는 있지만, 생물학적 뇌처럼 연속적인 의식의 흐름을 유지하지는 못한다.
backend-agnostic
백엔드 불가지론
특정 LLM 제공자나 인프라에 종속되지 않고 다양한 백엔드를 동일한 방식으로 사용할 수 있는 특성이다. 이를 통해 개발자는 코드 수정 없이 OpenAI API에서 로컬 Llama 모델로 백엔드를 자유롭게 교체할 수 있다.
attention-bias
어텐션 바이어스
Attention 연산 시 특정 토큰 간의 관계 점수에 특정 값을 더하거나 빼서 모델의 주목도를 강제로 조절하는 기법이다. 본 논문에서는 계산된 중요도 점수를 바이어스로 주입해 중요한 토큰에 연산이 집중되도록 유도한다.
recurrent-mechanism
재귀적 메커니즘
동일한 신경망 층을 여러 번 반복해서 통과시켜 파라미터 수를 늘리지 않고도 모델의 깊이를 깊게 만드는 구조다. 연산 효율성을 유지하면서 복잡한 논리 처리를 가능하게 한다.
mask-transformer
마스크 트랜스포머
학습 가능한 쿼리 토큰을 사용하여 이미지 내 객체의 마스크와 클래스를 예측하는 Transformer 기반 구조이다. 픽셀 단위 분류 대신 쿼리와 특징 맵의 내적을 통해 마스크를 생성한다.
adain
적응형 인스턴스 정규화
하나의 특징 맵의 평균과 분산을 다른 특징 맵의 통계량으로 변환하여 스타일이나 조건을 주입하는 정규화 기법이다. MoTok에서는 확산 모델의 노이즈 제거 과정 중에 토큰 정보를 동작 특징에 효과적으로 결합하는 데 사용된다.
causal-audio-encoder
인과적 오디오 인코더
미래의 오디오 프레임을 참조하지 않고 현재까지 입력된 정보만을 바탕으로 특징을 추출하는 구조이다. 실시간 스트리밍 환경에서 지연 시간을 최소화하기 위해 필수적으로 사용된다.
xlstm
확장된 장단기 메모리
기존 LSTM에 지수적 게이팅과 행렬 구조의 메모리를 도입하여 Transformer처럼 병렬 학습이 가능하도록 개선한 아키텍처이다. 시퀀스 길이에 따라 연산량이 선형적으로 증가하여 긴 문맥 처리에 효율적이며, Transformer의 강력한 대안으로 주목받고 있다.
isolated-workspace
격리된 작업 공간
각 에이전트가 다른 에이전트의 간섭 없이 독립적으로 작업을 수행할 수 있는 전용 환경이다. 데이터 오염을 방지하고 에이전트 간의 역할 책임을 명확히 분리하는 데 필수적이다.
hierarchical-reinforcement-learning
계층적 강화 학습
복잡한 문제를 해결하기 위해 행동을 상위 수준의 결정(전략 선택)과 하위 수준의 실행(세부 동작)으로 나누어 학습하는 방식이다. 장기적인 목표 달성과 추상적 사고가 필요한 작업에 유리하다.
looped-language-model
루프형 언어 모델
동일한 레이어 층을 여러 번 반복해서 통과하며 내부 데이터를 정교화하는 AI 구조이다. 고정된 레이어를 한 번만 지나는 기존 방식과 달리, 같은 파라미터를 재사용해 더 깊은 사고를 수행하면서도 모델 크기를 작게 유지할 수 있는 장점이 있다.
masked-diffusion-model
마스크 확산 모델
텍스트 시퀀스의 일부를 마스킹하고 이를 점진적으로 복구(unmasking)하는 과정을 통해 데이터를 생성하는 확률 모델이다. 자기회귀 모델과 달리 전체 시퀀스를 동시에 처리할 수 있어 병렬 생성에 유리하며, 최근 언어 모델링의 새로운 대안으로 주목받고 있다.
visual-world-model
시각적 세계 모델
특정 행동을 했을 때 화면이 어떻게 변할지 시각적으로 예측하는 모델이다. 에이전트가 실제 행동을 하기 전에 결과를 시뮬레이션하여 오류를 방지하고 계획을 최적화하는 데 기여한다.
recursive-language-model
재귀적 언어 모델
긴 컨텍스트를 한 번에 처리하는 대신 하위 에이전트를 재귀적으로 호출하여 정보를 요약하고 누적하는 방식의 모델 구조임. 긴 텍스트나 비디오를 작은 단위로 쪼개어 효율적으로 처리할 수 있게 함.
recursive-expansion-tree
재귀적 확장 트리
질문을 시나리오, 관점, 세부 기준의 3단계 계층 구조로 단계적으로 분해하여 평가 항목을 생성하는 알고리즘이다. 수직적 분해와 수평적 확장을 반복하여 평가 공간의 포괄성을 극대화한다.
moe-mixture-of-experts
전문가 혼합 모델
전체 파라미터 중 입력값에 따라 필요한 일부 전문가(Expert) 네트워크만 활성화하여 연산하는 모델 구조이다. 모델의 전체 용량은 키우면서도 추론 시 계산 비용을 효율적으로 유지할 수 있는 장점이 있다.
fourier-neural-operator
푸리에 신경 연산자
푸리에 변환을 신경망의 핵심 연산으로 사용하는 아키텍처이다. 일반적인 합성곱보다 넓은 범위를 한 번에 파악할 수 있어, 기상 현상처럼 거대한 대기 흐름을 다루는 시공간 예측 문제에서 뛰어난 효율성과 정확성을 보인다.
depthwise-separable-convolution
깊이별 분리 컨볼루션
채널별 공간 연산과 채널 간 혼합 연산을 분리하여 수행하는 기법이다. 일반 컨볼루션 대비 연산량과 파라미터 수를 획기적으로 줄이면서도 이미지의 공간적 특징을 효과적으로 추출할 수 있어 경량 모델에서 주로 사용된다.
isa-semantics
명령어 집합 구조 시맨틱
특정 CPU 아키텍처(x86, ARM 등)에서 각 기계어 명령어가 하드웨어의 상태(레지스터, 메모리 등)를 어떻게 변화시키는지 정의한 수학적 모델이다. 저수준 코드의 정확성을 증명하기 위해서는 이 모델에 대한 정확한 이해가 필요하다.
act-r
적응적 사고 통제 아키텍처
인간의 인지 과정을 시뮬레이션하기 위해 개발된 인지 아키텍처이다. 지식의 활성화와 감쇄를 수학적으로 모델링하여 에이전트가 어떤 정보를 기억하고 잊을지 결정하는 판단 근거를 제공한다.
p-iiss
확률적 증분 입력-상태 안정성
시스템에 입력된 작은 오차가 시간이 지나도 발산하지 않고 특정 범위 내로 억제되는 성질을 확률적으로 정의한 제어 이론 개념.
smpl-x
스킨드 멀티-퍼슨 선형 모델 익스텐션
인간의 체형과 포즈를 수학적 파라미터로 표현하는 3D 모델이다. 수천 개의 정점으로 구성된 메쉬를 통해 손가락 움직임과 얼굴 표정까지 정교하게 복원할 수 있어 3D 인간 재구성 연구의 표준으로 활용된다.
shared-control
공유 제어
인간 사용자와 자동화 시스템이 하나의 제어 대상을 동시에 또는 교대로 조종하는 아키텍처이다. 사용자의 조작 의도를 존중하면서도 시스템이 실시간으로 위험을 감지해 안전을 보장하는 협력적 제어 방식이다.