# DeepSeek V4 深度解析：10 位从业者的真实评价

36氪专访 10 位 AI 行业从业者，对 DeepSeek V4 进行全面解读。V4 在工程优化上令人惊艳，但并非全能——它对应用层的影响可能大于模型层本身。

## 核心亮点：极致工程优化

### 关键技术突破

- **混合注意力机制（CSA + HCA）：** 实现"粗读大局 + 精读细节"协同
- **MoE（混合专家模型）：** 1.6T 总参数，每次仅激活 49B，效率极高
- **KV 缓存压缩至 10%：** 百万 Token 上下文存储大幅降低
- **后训练与推理工程：** 多环节组合优化

### 性能数据

| 指标 | V4-Pro 表现 | 对比 |
|------|-----------|------|
| 长上下文计算成本 | 前代 V3.2 的 **27%** | 大幅降低 |
| KV 缓存占用 | 原来的 **10%** | 极致压缩 |
| 激活参数 | 49B（1.6T 总参） | 极高效 |
| API 价格（Flash 版） | 1 元/百万 Token | 头部模型 1/4 以下 |

### 从业者评价（正面）

> **黄东旭（PingCAP CTO）：** "效果比想象中好，中文能力更符合母语者习惯。能力约 Claude Sonnet 4.5-4.6 水平，但价格不到 1/4。我已完全切换日常 Agent。"

> **赵斌强（零一万物副总裁）：** "最惊艳的是**国产算力全栈适配**（华为昇腾 910B/950），完全公开技术细节。虽不能说完全摆脱英伟达依赖，但已找到正确方向。"

> **李博杰（Pine AI 首席科学家）：** "最惊艳的是把 MoE、混合注意力、Muon 等一长串架构创新真正在 1.6T 规模上跑通了。这是目前最大开源规模。"

## 明显短板

| 弱点 | 表现 | 备注 |
|------|------|------|
| 事实性知识 | 幻觉率高，Flash 版事实问答仅 34.1% | 不宜作搜索引擎 |
| 工具调用稳定性 | 长链任务中错误累积 | 需 Harness 层补足 |
| 复杂推理 | 极端场景弱于顶级闭源 | 相当于 Claude 一年前水平 |
| 无多模态 | 不支持图像输入/输出 | 纯文本模型 |

> **Chillin（Coding Agent 创业者）：** "内部测评结论：Coding Agent 场景下，V4 是 Claude 一年多前的水平。要落地还需额外脚手架。"

## 行业影响：AI 应用生态转折点

1. **模型供给层丰富化：** 企业可灵活编排多模型
2. **开源倒逼闭源降价：** 行业利润从基座模型向深度应用迁移
3. **Harness 能力成为新分水岭：** 从开源模型到企业级产品还需幻觉消除、指令遵循等工程能力
4. **国产算力产业链崛起：** 华为昇腾适配验证了国产全栈方案可行性

> **李博杰：** "Agent 经济性的拐点就在这一波——只要业界在 Harness 层把 V4 的工具调用稳定性和幻觉率补齐，多步研究、长程代码 Agent 今年下半年将走出 demo 进入真实业务。"

---

## 参考链接

- [别急着 All-in DeepSeek V4，先看看这 10 位从业者的真心话 - 36氪](https://36kr.com/p/3788151000751364)