# Oh-My-OpenAgent (OMO) 配置方案

> 基于 2026 年 5 月模型市场情况，为 OpenCode + OMO 插件定制的成本优化配置。
> 核心策略：DeepSeek V4 系列为主力军，GPT-5.5 与 Gemini 3.5 Flash 补充关键场景。

---

## 一、工具概述

### OpenCode
- 开源 AI 编码代理（160K+ GitHub Stars，900+ 贡献者）
- 支持终端 TUI、桌面应用、IDE 扩展
- 支持 75+ LLM 提供商，隐私优先（不存储代码/上下文数据）
- 提供 `opencode serve`（headless API）、`opencode run`（非交互式）、`opencode agent` 等命令
- 官网：https://opencode.ai/docs

### Oh-My-OpenAgent (OMO)
- OpenCode 的多模型代理编排插件
- 将单一 AI 代理转变为协作开发团队
- 11 个内置代理 + 8 个内置类别
- 52 个生命周期钩子、26 个工具、技能/命令/MCP 系统
- 配置文件：`.opencode/oh-my-openagent.jsonc`（项目级）或 `~/.config/opencode/oh-my-openagent.jsonc`（用户级）
- 官网：https://ohmyopenagent.com/zh/docs

---

## 二、可用模型与价格

> 以下价格为中转站渠道实际价格（¥/1M tokens），格式：输入/输出/缓存命中

### Google Gemini
| 模型                     | 输入    | 输出   | 缓存命中  | 定位                       |
| ---------------------- | ----- | ---- | ----- | ------------------------ |
| gemini-3.1-pro-preview | 3     | 18   | 0.3   | 顶级推理 + 多模态旗舰             |
| gemini-3.5-flash       | 2.25  | 13.5 | 0.225 | 新一代 Flash，代理编码 + 视觉 SOTA |
| gemini-3.1-flash-lite  | 0.375 | 2.25 | 0.038 | 最低成本，高吞吐场景               |

### OpenAI GPT
| 模型           | 输入   | 输出   | 缓存命中  | 定位                |
| ------------ | ---- | ---- | ----- | ----------------- |
| gpt-5.5      | 3    | 18   | 0.3   | 前沿代理编码/计算机使用/知识工作 |
| gpt-5.4      | 1.5  | 9    | 0.15  | 上一代主力，强推理         |
| gpt-5.4-mini | 0.45 | 2.7  | 0.045 | 高性价比编码，支持计算机使用    |
| gpt-5.4-nano | 0.12 | 0.75 | -     | 最便宜，分类/提取/简单子代理   |

### Anthropic Claude
| 模型 | 输入 | 输出 | 缓存命中 | 定位 |
|------|------|------|----------|------|
| claude-opus-4.7 | 5 | 25 | 0.5 | 最强代理编码，指令遵循，可靠性 |
| claude-sonnet-4.6 | 3 | 15 | 0.3 | 速度与智能最佳平衡 |
| claude-haiku-4.5 | 1 | 5 | 0.1 | 最快速度（~97 t/s），近前沿智能 |

### DeepSeek
| 模型 | 输入 | 输出 | 缓存命中 | 定位 |
|------|------|------|----------|------|
| deepseek-v4-pro | 3 | 6 | 0.025 | 开源 SOTA，1.6T/49B 激活，编码顶级 |
| deepseek-v4-flash | 1 | 2 | 0.02 | 284B/13B 激活，接近 Pro 编码能力，极致性价比 |

---

## 三、模型能力详细分析

### DeepSeek V4 Pro（主力编码引擎）
- **架构**：1.6T 总参数 / 49B 激活，MoE，MIT 开源
- **上下文**：1M tokens
- **编码**：SWE-bench Verified 80.6%，LiveCodeBench 93.5%，Codeforces 3206
- **推理**：GPQA Diamond 90.1%，MMLU-Pro 87.5
- **代理**：Terminal-Bench 2.0 67.9%，GDPval-AA 1554 Elo
- **核心优势**：编码能力对标闭源顶级模型，LiveCodeBench 超越 Claude Opus 4.7（88.8%）；CSA+HCA 混合注意力使长上下文推理成本极低（1M 时仅 V3.2 的 27% FLOPs 和 10% KV 缓存）
- **弱点**：纯知识任务弱于 Gemini 3.1 Pro；高幻觉率（~94% 不知道时仍会回答）

### DeepSeek V4 Flash（主力快速引擎）
- **架构**：284B 总参数 / 13B 激活，MoE
- **上下文**：1M tokens
- **编码**：SWE-bench Verified 79.0%，LiveCodeBench 91.6%
- **推理**：GPQA Diamond 88.1%
- **核心优势**：编码仅落后 Pro ~1.6 个百分点（SWE-bench），但价格仅为 Pro 的 1/3；官方称「Max 模式下推理能力接近 Pro」；适合大多数开发工作中的编码任务
- **弱点**：纯知识任务和复杂代理工作流落后于 Pro

### GPT-5.5（顶级代理编码+计算机使用）
- **上下文**：1M API / 400K Codex
- **编码**：Terminal-Bench 2.0 82.7%（SOTA），SWE-Bench Pro 58.6%
- **代理**：OSWorld-Verified 78.7%，MCP Atlas 75.3%
- **知识**：GDPval-AA 84.9%，BrowseComp 84.4%
- **核心优势**：代理编码终端基准测试绝对领先；token 效率高（比 GPT-5.4 用更少 token 完成同等任务）；计算机使用能力突出
- **弱点**：输出价格 ¥18/1M，是 DeepSeek V4 Pro 的 3 倍

### Gemini 3.5 Flash（视觉+代理编码专精）
- **上下文**：1M tokens 输入 / 64K 输出
- **编码**：Terminal-Bench 2.1 76.2%（超越 Gemini 3.1 Pro 的 70.3%），SWE-Bench Pro 55.1%
- **代理**：MCP Atlas 83.6%，OSWorld-Verified 78.4%
- **多模态**：MMMU-Pro 83.6%，CharXiv 84.2%
- **核心优势**：新一代 Flash，代理编码和 MCP 工具使用全面超越 3.1 Pro；多模态理解顶级；输出价格低于 3.1 Pro（¥13.5 vs ¥18）
- **弱点**：可能出现「误导性注意力」问题

### 未选用模型说明
- **GPT-5.4**（¥1.5/9）：编码/代理全面弱于 DeepSeek V4 Pro且价格更高，不采用
- **GPT-5.4 mini**（¥0.45/2.7）：SWE-bench Pro 仅 54.4%，远弱于 V4 Flash（79.0%），性价比不足
- **GPT-5.4 nano**（¥0.12/0.75）：SWE-bench Pro 52.4%，虽然极便宜但能力差距大
- **Claude Sonnet 4.6**（¥3/15）：输出价格昂贵，编码基准不如 V4 Pro
- **Claude Haiku 4.5**（¥1/5）：SWE-bench 73.3%，不如 V4 Flash（79.0%）且输出更贵
- **Gemini 3.1 Flash Lite**（¥0.375/2.25）：输出比 V4 Flash 贵，能力差距大
- **Claude Opus 4.7**（¥5/25）：输出极贵（¥25/1M），GPT-5.5 在代理编码上更强且便宜

---

## 四、OMO 代理与类别角色

### 11 个内置代理

| 代理 | 角色 | 类型 | 说明 |
|------|------|------|------|
| **Sisyphus** | 主编排器 | Primary | 规划、委派、驱动完成，激进并行执行 |
| **Hephaestus** | 自主深度工作者 | Primary | GPT 原生，给目标即自主探索/研究/执行 |
| **Prometheus** | 战略规划师 | Primary | 访谈式规划，按 Tab 进入，生成详细计划 |
| **Atlas** | 执行指挥 | Primary | 执行 Prometheus 计划，分发任务给子代理 |
| **Oracle** | 架构顾问 | Subagent | 只读高 IQ 顾问，负责架构和调试咨询 |
| **Metis** | 差距分析器 | Subagent | 捕获 Prometheus 遗漏的内容 |
| **Momus** | 严格审查者 | Subagent | 验证计划的清晰度、验证性、上下文 |
| **Librarian** | 文档搜索 | Subagent | 文档和 OSS 代码搜索 |
| **Explore** | 代码库搜索 | Subagent | 快速代码库 grep（速度优先） |
| **Multimodal Looker** | 视觉分析 | Subagent | 截图和视觉分析 |
| **Sisyphus-Junior** | 类别路由器 | Subagent | 将 category 映射到具体代理 |

### 8 个内置类别

| 类别                     | 默认用途            | 原默认模型               |
| ---------------------- | --------------- | ------------------- |
| **ultrabrain**         | 深度逻辑推理、复杂架构     | GPT-5.4 xhigh       |
| **deep**               | 自主问题解决、深入研究     | GPT-5.4 medium      |
| **quick**              | 琐碎任务、拼写修正、单文件修改 | GPT-5.4 mini        |
| **unspecified-low**    | 一般任务，低投入        | Claude Sonnet 4.6   |
| **unspecified-high**   | 一般任务，高投入        | Claude Opus 4.7 max |
| **visual-engineering** | 前端、UI/UX、设计、动画  | Gemini 3.1 Pro high |
| **artistry**           | 创意/非传统方法        | Gemini 3.1 Pro high |
| **writing**            | 文档、技术写作         | Gemini 3 Flash      |

---

## 五、推荐配置

### 配置策略

```
主力军（最高频，控制成本）  → DeepSeek V4 Pro / V4 Flash
高难度重要（低频但关键）    → GPT-5.5
中等难度（常规工作）        → DeepSeek V4 Pro / V4 Flash
快速简单（高频低难度）      → DeepSeek V4 Flash
特种视觉（前端/截图）       → Gemini 3.5 Flash
```

### 完整配置文件

保存为 `.opencode/oh-my-openagent.jsonc`（项目级）或 `~/.config/opencode/oh-my-openagent.jsonc`（用户级）：

```jsonc
{
  "$schema": "https://raw.githubusercontent.com/code-yeongyu/oh-my-openagent/dev/assets/oh-my-opencode.schema.json",

  // ========== 代理模型分配 ==========
  "agents": {
    // 主编排器：每项任务都经此流转，使用 DeepSeek V4 Pro 高频推理
    "sisyphus": {
      "model": "deepseek/deepseek-v4-pro",
      "reasoningEffort": "high"
    },

    // 自主深度工作者：给目标即自主探索执行，Pro Max 模式
    "hephaestus": {
      "model": "deepseek/deepseek-v4-pro",
      "reasoningEffort": "max"
    },

    // 战略规划师：访谈式规划，继承 Sisyphus 模型
    "prometheus": {
      "model": "deepseek/deepseek-v4-pro",
      "reasoningEffort": "high"
    },

    // 架构顾问（只读）：高难度重要任务，使用 GPT-5.5
    "oracle": {
      "model": "openai/gpt-5.5",
      "reasoningEffort": "high"
    },

    // 差距分析器：中等难度，快速审查
    "metis": {
      "model": "deepseek/deepseek-v4-flash"
    },

    // 严格审查者：审查质量重要，Pro 高推理
    "momus": {
      "model": "deepseek/deepseek-v4-pro",
      "reasoningEffort": "high"
    },

    // 文档搜索：简单搜索任务
    "librarian": {
      "model": "deepseek/deepseek-v4-flash"
    },

    // 代码库搜索：速度优先
    "explore": {
      "model": "deepseek/deepseek-v4-flash"
    },

    // 视觉分析：Gemini 专长
    "multimodal-looker": {
      "model": "google/gemini-3.5-flash"
    },

    // 执行指挥：需要可靠性，Pro 高推理
    "atlas": {
      "model": "deepseek/deepseek-v4-pro",
      "reasoningEffort": "high"
    },

    // 类别路由器：简单路由
    "sisyphus-junior": {
      "model": "deepseek/deepseek-v4-flash"
    }
  },

  // ========== 类别模型分配 ==========
  "categories": {
    // 深度推理/复杂架构：最高难度，GPT-5.5 全力
    "ultrabrain": {
      "model": "openai/gpt-5.5",
      "reasoningEffort": "xhigh"
    },

    // 自主问题解决：主力军 Pro Max
    "deep": {
      "model": "deepseek/deepseek-v4-pro",
      "reasoningEffort": "max"
    },

    // 快速简单任务：Flash 极速
    "quick": {
      "model": "deepseek/deepseek-v4-flash"
    },

    // 一般低投入：Flash 够用
    "unspecified-low": {
      "model": "deepseek/deepseek-v4-flash"
    },

    // 一般高投入：Pro 高推理
    "unspecified-high": {
      "model": "deepseek/deepseek-v4-pro",
      "reasoningEffort": "high"
    },

    // 前端/UI/UX/设计：Gemini 3.5 Flash（多项视觉基准超越 3.1 Pro）
    "visual-engineering": {
      "model": "google/gemini-3.5-flash",
      "reasoningEffort": "high"
    },

    // 创意/非传统：Gemini 创造力 + 多模态
    "artistry": {
      "model": "google/gemini-3.5-flash",
      "reasoningEffort": "high"
    },

    // 文档/技术写作：Pro 文本生成
    "writing": {
      "model": "deepseek/deepseek-v4-pro"
    }
  }
}
```

### 成本估算对比

| 场景 | 默认配置（Opus/Sonnet/GPT-5.4） | 本配置 | 节省比例 |
|------|-------------------------------|--------|----------|
| Sisyphus 主编排（高频） | Opus 4.7 ¥5/25 | V4 Pro ¥3/6 | 输入 -40%，输出 -76% |
| Oracle 架构咨询 | GPT-5.4 ¥1.5/9 | GPT-5.5 ¥3/18 | 输入 +100%，输出 +100%（但低频、任务关键） |
| quick 简单任务 | GPT-5.4 mini ¥0.45/2.7 | V4 Flash ¥1/2 | 输入 +122%，输出 -26%（能力大幅提升） |
| visual-engineering | Gemini 3.1 Pro ¥3/18 | Gemini 3.5 Flash ¥2.25/13.5 | 输入 -25%，输出 -25%（且基准更高） |

---

## 六、参考链接

- OpenCode 官网：https://opencode.ai/docs
- OMO 英文文档：https://ohmyopenagent.com/docs
- OMO 中文文档：https://ohmyopenagent.com/zh/docs
- OMO GitHub：https://github.com/code-yeongyu/oh-my-openagent
- OMO 配置参考：https://github.com/code-yeongyu/oh-my-openagent/blob/HEAD/docs/reference/configuration.md
- DeepSeek V4 HuggingFace：https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash
- DeepSeek V4 官方公告：https://api-docs.deepseek.com/news/news260424
- DeepSeek V4 基准分析：https://deepseekai.guide/news/deepseek-benchmarks-2026/
- Artificial Analysis V4 评测：https://artificialanalysis.ai/articles/deepseek-is-back-among-the-leading-open-weights-models-with-v4-pro-and-v4-flash
- GPT-5.5 官方公告：https://openai.com/index/introducing-gpt-5-5/
- GPT-5.4 mini/nano 官方公告：https://openai.com/index/introducing-gpt-5-4-mini-and-nano/
- Gemini 3.5 Flash 模型卡：https://deepmind.google/models/model-cards/gemini-3-5-flash/
- Claude 模型总览：https://platform.claude.com/docs/en/about-claude/models/overview
- Claude Opus 4.7 官方：https://www.anthropic.com/claude/opus