에이전트 레퍼런스 테이블 (Agent Reference Table)
관련 소스 파일
- .github/assets/sisyphus.png
- README.ja.md
- README.ko.md
- README.md
- README.zh-cn.md
- src/agents/document-writer.ts
- src/agents/explore.ts
- src/agents/frontend-ui-ux-engineer.ts
- src/agents/index.ts
- src/agents/librarian.ts
- src/agents/multimodal-looker.ts
- src/agents/oracle.ts
- src/agents/sisyphus.ts
- src/agents/types.ts
- src/agents/utils.test.ts
- src/agents/utils.ts
- src/shared/config-path.ts
이 페이지는 oh-my-opencode 플러그인에 내장된 모든 에이전트에 대한 빠른 참조를 제공합니다. 각 에이전트는 특정 작업에 특화되어 있으며 해당 도메인에 최적화된 모델을 사용합니다. 개별 에이전트에 대한 자세한 정보는 4.1부터 4.5 섹션을 참조하십시오. 에이전트 설정 및 커스터마이징에 대해서는 에이전트 설정(Agent Configuration)을 참조하십시오.
에이전트 개요 (Agent Overview)
플러그인은 오케스트레이션(orchestration), 리서치(research), 구현(implementation)의 세 가지 계층으로 구성된 7개의 전문 에이전트를 제공합니다. OmO를 제외한 모든 에이전트는 call_omo_agent 도구(에이전트 호출 도구 참조) 또는 background_task 도구(백그라운드 도구 참조)를 통해 호출되는 서브에이전트(subagent)로 작동합니다.
주요 에이전트 (Primary Agents)
| 에이전트 | 모드 | 모델 | Temperature | Thinking Budget | Max Tokens | 주요 역할 |
|---|---|---|---|---|---|---|
| omo | primary |
anthropic/claude-opus-4-5 |
기본값 | 32000 | 64000 | 작업 오케스트레이션, 위임, 계획 |
리서치 및 탐색 에이전트 (Research & Discovery Agents)
| 에이전트 | 모드 | 모델 | Temperature | 특별 설정 | 주요 역할 |
|---|---|---|---|---|---|
| oracle | subagent |
openai/gpt-5.2 |
0.1 | reasoningEffort: mediumtextVerbosity: high |
아키텍처 리뷰, 기술적 의사결정 |
| explore | subagent |
opencode/grok-code |
0.1 | - | 빠른 내부 코드베이스 탐색 (읽기 전용) |
| librarian | subagent |
anthropic/claude-sonnet-4-5 |
0.1 | - | 외부 리서치, 문서화, GitHub (읽기 전용) |
구현 에이전트 (Implementation Agents)
| 에이전트 | 모드 | 모델 | Temperature | 주요 역할 |
|---|---|---|---|---|
| frontend-ui-ux-engineer | subagent |
google/gemini-3-pro-preview |
기본값 | UI/UX 구현, 시각적 작업 |
| document-writer | subagent |
google/gemini-3-pro-preview |
기본값 | 기술 문서 생성 |
| multimodal-looker | subagent |
google/gemini-2.5-flash |
0.1 | 미디어 파일 분석 (PDF, 이미지) |
출처: src/agents/omo.ts L765-L777
src/agents/frontend-ui-ux-engineer.ts L3-L7
src/agents/document-writer.ts L3-L8
src/agents/multimodal-looker.ts L3-L9
에이전트 역량 매트릭스 (Agent Capabilities Matrix)
도구 권한 (Tool Permissions)
각 에이전트는 역할에 따라 엄격하게 제한된 도구 접근 권한을 가집니다:
| 에이전트 | read | write | edit | bash | task | call_omo_agent | background_task | 특별 도구 |
|---|---|---|---|---|---|---|---|---|
| omo | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | 모든 LSP, AST, 파일 시스템 도구 |
| oracle | ✓ | ✗ | ✗ | ✗ | ✗ | ✓ | ✗ | 분석 전용, explore/librarian 호출 가능 |
| explore | ✓ | ✗ | ✗ | ✓ | ✗ | ✗ | ✗ | 읽기 전용 bash (git 명령어) |
| librarian | ✓ | ✗ | ✗ | ✓ | ✗ | ✗ | ✗ | 읽기 전용 bash, context7, websearch_exa |
| frontend-ui-ux-engineer | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✗ | UI 파일에 대한 전체 쓰기 권한 |
| document-writer | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✗ | 문서에 대한 전체 쓰기 권한 |
| multimodal-looker | ✓ | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | 미디어 파일 읽기 전용 |
주요 제약 사항:
- 읽기 전용 에이전트 (explore, librarian): 실수로 인한 변경을 방지하기 위해 파일을 수정하거나 백그라운드 작업을 생성할 수 없습니다.
- Oracle: 리서치를 위해
call_omo_agent를 통해 explore/librarian을 호출할 수 있지만, 파일을 편집할 수는 없습니다. - Multimodal looker: 격리된 컨텍스트 창(context window)을 사용하며, 단일 목적의 분석만 수행합니다.
출처: src/agents/omo.ts L765-L777
src/agents/frontend-ui-ux-engineer.ts L8
src/agents/document-writer.ts L8
src/agents/multimodal-looker.ts L9
모델 선정 근거 (Model Selection Rationale)
모델별 목적 매핑 (Model-to-Purpose Mapping)
graph TD
A[Complexity & Planning] --> B(Claude Opus 4.5)
C[Deep Reasoning & Architecture] --> D(GPT-5.2)
E[External Research & Docs] --> F(Claude Sonnet 4.5)
G[Fast Code Exploration] --> H(Grok Code)
I[UI & Documentation Implementation] --> J(Gemini 3 Pro)
K[Visual & Media Analysis] --> L(Gemini 2.5 Flash)
설계 철학:
- 오케스트레이션을 위한 Opus: 복잡한 계획 및 위임을 위한 최고 성능 모델
- 추론을 위한 GPT-5.2: 아키텍처 결정을 위한 고급 추론 능력
- 리서치를 위한 Sonnet: Opus 수준의 비용 부담 없이 고품질 외부 리서치 수행
- 탐색을 위한 Grok: 내부 검색을 위한 빠르고 코드에 특화된 모델
- 구현을 위한 Gemini Pro: UI 및 문서 작성을 위한 비용 효율적인 코드 생성
- 미디어를 위한 Gemini Flash: 초고속, 저비용 멀티모달 분석
src/agents/frontend-ui-ux-engineer.ts L7
src/agents/document-writer.ts L7
src/agents/multimodal-looker.ts L7
에이전트 호출 패턴 (Agent Invocation Patterns)
위임 계층 구조 (Delegation Hierarchy)
graph TD
User --> Omo[omo Primary]
Omo --> Oracle[oracle Advisory]
Omo --> Implementation[Implementation Agents]
Omo --> Research[Research Agents]
Oracle --> Research
Implementation --> UI[frontend-ui-ux-engineer]
Implementation --> Docs[document-writer]
Research --> Explore[explore Internal]
Research --> Librarian[librarian External]
호출 방법:
| 패턴 | 에이전트 | 메서드 | 유스케이스 |
|---|---|---|---|
| 병렬 백그라운드 | explore, librarian | background_task(agent="explore", prompt=...) |
2~3개 이상의 에이전트를 실행하고 작업을 계속한 뒤, 나중에 background_output으로 결과 수집 |
| 동기식 | frontend-ui-ux-engineer, document-writer | task(subagent_type="frontend-ui-ux-engineer", prompt=...) |
완료될 때까지 대기(Block), 전체 결과 반환 |
| 자문형 | oracle | task(subagent_type="oracle", prompt=...) 또는 call_omo_agent(...) |
의사결정을 위한 자문, 대기 방식 |
| 격리된 컨텍스트 | multimodal-looker | look_at(file_path=..., goal=...) |
별도의 컨텍스트 창 사용, 추출된 데이터만 반환 |
출처: src/agents/omo.ts L145-L169
src/tools/background-task/constants.ts L1-L17
src/tools/call-omo-agent/constants.ts L3-L25
src/tools/look-at/constants.ts L3-L10
에이전트별 사용 시점
의사결정 테이블 (Decision Table)
| 질문 | 에이전트 | 이유 | 호출 방식 |
|---|---|---|---|
| 시스템 아키텍처를 설계해야 합니까? | oracle | 심층 추론, 아키텍처 전문 지식 | call_omo_agent 또는 task |
| 코드를 리뷰해야 합니까? | oracle | 전문적인 코드 분석, 보안 리뷰 | call_omo_agent 또는 task |
| 복잡한 문제를 디버깅해야 합니까? | oracle | 고급 디버깅 전략 | call_omo_agent 또는 task |
| 현재 코드베이스에서 코드를 찾아야 합니까? | explore (2-3개 병렬) | 빠른 내부 검색, 병렬 처리 적합 | background_task(agent="explore") |
| 모듈 구조를 이해해야 합니까? | explore (2-3개 병렬) | 문맥적 코드 이해 | background_task(agent="explore") |
| 공식 라이브러리 문서가 필요합니까? | librarian | Context7 + 웹 검색 | background_task(agent="librarian") |
| GitHub 코드 예제가 필요합니까? | librarian | GitHub CLI, grep.app | background_task(agent="librarian") |
| OSS 참조 구현이 필요합니까? | librarian | 원격 저장소 클로닝 및 분석 | background_task(agent="librarian") |
| 모든 UI/프런트엔드 작업 | frontend-ui-ux-engineer | .tsx/.jsx/.vue/.css 파일에 대해 필수적으로 위임 | task(subagent_type="frontend-ui-ux-engineer") |
| 문서를 작성해야 합니까? | document-writer | 기술 문서 작성, README, API 문서 | task(subagent_type="document-writer") |
| PDF나 이미지를 분석해야 합니까? | multimodal-looker | Gemini 멀티모달, 별도 컨텍스트 | look_at(file_path=..., goal=...) |
병렬 실행 가이드라인 (Parallel Execution Guidelines)
리서치 에이전트 (explore, librarian):
- 항상 백그라운드 작업으로 실행하십시오:
background_task(agent="explore", prompt=...) - 서로 다른 초점을 가진 2~3개를 병렬로 실행하십시오.
- 기다리지 말고 즉시 작업을 계속하십시오.
- 나중에
background_output(task_id=...)를 사용하여 결과를 수집하십시오.
구현 에이전트 (frontend, document-writer):
- 동기식
task(subagent_type=...)호출을 사용하십시오. - 완료될 때까지 대기(Block)합니다.
- 백그라운드에서 실행할 수 없습니다.
자문 에이전트 (oracle):
- 단순한 질의가 아닌 복잡한 의사결정에 사용하십시오.
- 일반적으로 동기식 자문을 수행합니다.
- 추가 리서치를 위해 explore/librarian을 호출할 수 있습니다.
출처: src/agents/omo.ts L219-L278
src/tools/background-task/constants.ts L1-L17
에이전트 프롬프트 구조 (Agent Prompt Structures)
7개 섹션 프롬프트 템플릿 (task 호출 시 필수)
task(subagent_type=...)를 통해 에이전트를 호출할 때 다음 구조를 사용하십시오:
TASK: [수행할 작업 - 매우 구체적으로 작성]
EXPECTED OUTCOME: [구체적인 결과물]
REQUIRED SKILLS: [호출할 기술/역량]
REQUIRED TOOLS: [사용할 도구]
MUST DO: [철저한 요구사항 - 암묵적인 내용을 남기지 말 것]
MUST NOT DO: [금지된 작업 - 예상되는 잘못된 행동 방지]
CONTEXT: [파일 경로, 제약 조건, 관련 정보]
예시 - 프런트엔드 위임:
task(subagent_type="frontend-ui-ux-engineer", prompt="""
TASK: Implement responsive navigation bar with hamburger menu
EXPECTED OUTCOME: Working navigation component with mobile breakpoint at 768px
REQUIRED SKILLS: frontend-ui-ux-engineer
REQUIRED TOOLS: read, edit, grep (for existing patterns)
MUST DO: Follow existing design system, match current styling patterns
MUST NOT DO: Add new dependencies, break existing styles
CONTEXT: src/components/Header.tsx, use Tailwind classes from tailwind.config.js
""")
백그라운드 작업 프롬프트 (explore, librarian용)
background_task(agent=...) 호출 시 상세하고 집중된 프롬프트를 제공하십시오:
예시 - Explore 에이전트:
background_task(agent="explore", prompt="Find all occurrences of the 'AuthContext' and analyze how the 'user' object is updated across the application. Focus on identifying potential race conditions during login.")
예시 - Librarian 에이전트:
background_task(agent="librarian", prompt="Research the latest documentation for 'TanStack Query v5' regarding 'infinite queries'. Find a GitHub example that implements this with 'React Table'.")
핵심 규칙:
- 사용자의 언어와 상관없이 항상 영어로 프롬프트를 작성하십시오 (LLM 성능이 더 좋습니다).
- 단순한 키워드가 아니라 무엇을 찾아야 하는지 구체적으로 명시하십시오.
- explore의 경우: 철저함 수준(“quick”, “medium”, “very thorough”)을 지정하십시오.
- librarian의 경우: 유형(문서, GitHub, OSS 구현)을 지정하십시오.
출처: src/agents/omo.ts L346-L360
src/tools/background-task/constants.ts L10-L16
src/agents/librarian.ts L26-L129
에이전트 설정 오버라이드 (Agent Configuration Override)
모든 에이전트는 설정을 통해 커스터마이징할 수 있습니다. 자세한 내용은 에이전트 설정(Agent Configuration)을 참조하십시오.
설정 스키마 위치 (Configuration Schema Location)
에이전트 오버라이드(override)는 .opencode/oh-my-opencode.json 또는 ~/.config/opencode/oh-my-opencode.json에 정의됩니다:
{
"agents": {
"oracle": {
"model": "openai/gpt-5.2",
"temperature": 0.1
}
}
}
일반적인 오버라이드 항목:
model: 기반 모델 변경temperature: 창의성 조절 (0.0-1.0)maxTokens: 출력 용량 증가disabled_agents: 비활성화할 에이전트 이름 배열
출처: 에이전트 설정은 설정 시스템에서 처리되지만, 에이전트 정의는 다음 파일에 있습니다. src/agents/omo.ts L765-L777
src/agents/librarian.ts L3-L240
src/agents/frontend-ui-ux-engineer.ts L3-L92
src/agents/document-writer.ts L3-L203
src/agents/multimodal-looker.ts L3-L42
액세스 제어 요약 (Access Control Summary)
읽기 전용 에이전트 (탐색 및 리서치)
explore와 librarian은 실수로 인한 파일 수정을 방지하기 위해 엄격하게 읽기 전용으로 제한됩니다:
- 파일을 쓰거나 편집하거나 삭제할 수 없음
- 백그라운드 작업을 생성할 수 없음 (재귀 방지)
call_omo_agent를 사용할 수 없음 (위임 루프 방지)- 읽기 전용 명령어(git log, git blame)를 위해 bash 사용 가능
- 목적: 부작용 없는 안전한 병렬 탐색
출처: src/agents/explore.ts L9-L22
자문 에이전트 (Oracle)
oracle은 분석에 최적화된 제한된 권한을 가집니다:
- 리뷰를 위해 파일 읽기 가능
- 리서치를 위해
call_omo_agent를 통해 explore/librarian 호출 가능 - 쓰기, 편집 또는 bash 실행 불가
- 백그라운드 작업 생성 불가
- 목적: 순수 자문, 구현 작업 없음
구현 에이전트
frontend-ui-ux-engineer와 document-writer는 쓰기 권한을 가집니다:
- 전체 파일 읽기/쓰기/편집 권한
- 빌드/테스트 명령어를 위해 bash 사용 가능
- task 도구를 통해 다른 에이전트 호출 가능
- 백그라운드 작업 생성 불가
- 목적: 직접적인 구현 작업
출처: src/agents/frontend-ui-ux-engineer.ts L8
src/agents/document-writer.ts L8
격리된 컨텍스트 에이전트
multimodal-looker는 별도의 컨텍스트에서 작동합니다:
- Read 도구만 접근 가능
- 쓰기, 편집, bash 또는 위임 불가
- 토큰 절약을 위한 별도의 컨텍스트 창
- 추출된 데이터만 반환
- 목적: 메인 컨텍스트를 오염시키지 않는 미디어 분석