综述 / 基础黄佳2026-04-13
View Original万字综述 Harness 革命
原文: 微信公众号 Datawhale · 黄佳 · 2026-04-13 分类: 综述 / 基础
概述
新加坡科研机构 AI 研究员、《动手做AI Agent》《Agent设计模式》作者黄佳在 Datawhale 带来了一场关于 Agent Harness 的深度分享。在 2026 年,当大模型能力进入高原期,Harness 正在成为决定 Agent 系统成败的关键。
2026 年的关键转折:从拼模型到拼 Harness
我们现在在 2026 年这个时间节点,当模型的能力进入高原期——模型智力已经在线、过关了。无论是中国的还是外国的模型都可以。
我们现在比拼的是 Harness。
DeepMind 的 Agents 团队做的实验很有名:用同一个模型,只换 Harness、换模型的外围,性能就能够产生巨大的差异。Claude Code 本身现在进步这么快,它的商业价值也如日中天,都表明 Harness 是战略级别的资产。
Harness 的历史必然性:30 年软件工程的启示
Harness 的出现不是偶然,而是历史的必然。工程师一直都在跟系统的复杂度做斗争。技术架构演进二十几年不变的核心就是:如何驾驭复杂性。
| 年代 | 驾驭目标 | 代表作 |
|---|---|---|
| 1994 | 对象的复杂性 | GOF《Design Patterns》23 种设计模式 |
| 2002 | 企业架构的复杂性 | Martin Fowler《企业应用架构模式》、Eric Evans《DDD》 |
| 2010 | 分布式系统的复杂性 | 微服务、消息队列、最终一致性 |
| 2017 | 数据系统的复杂性 | Martin Kleppmann《DDIA》 |
| 2026 | 智能体的复杂性 | Harness Engineering |
Agent 是第一个不确定性系统——它是概率机器,输入一个东西不一定按你的要求走。Harness 就是我们驾驭 Agent 的缰绳。
从 Prompt 到 Context 再到 Harness:三次跃迁
| 阶段 | 时间 | 核心 |
|---|---|---|
| Prompt Engineering | 2023 | 如何让大模型理解我们(CoT、Few-shot) |
| Context Engineering | 2024-2025 | 给大模型什么 = 从大模型得到什么(RAG、知识库) |
| Harness Engineering | 2026 | 设计可控的 Agent 系统(循环策略、工具、质量审核、分发治理) |
Agent = Model + Harness
Harness 就是包裹模型运行的基础设施:
Harness 做的就是把大模型的大脑变成了 Agent 的身体。
Harness 六大核心组件
- Agentic Loop — 最重要的心脏。接受输入、工具执行、反复运作,最后返回结果。与 ReAct(推理+行动循环)一脉相承。
- Tool System — 工具调用,扩展大模型的行动范围。
- Memory & Context Management — 记忆和上下文管理。Claude Code 在 Context Engineering 方面领先好几条街。
- Guardrails — Allow / Deny / Ask 权限控制,缰绳的核心。
- Hooks — 守卫机制(如防止敏感文件泄露)。
- Session — 会话连续性控制。
Harness 解决的五大落地难题
- 无限循环问题
- 上下文爆炸问题
- 权限失控问题
- 质量不可控问题
- 成本不透明问题
当前 Harness 生态格局
| 类型 | 代表 | 定位 |
|---|---|---|
| 纵深型 | Claude Code | 深度工程开发,Harness 的 Number One |
| 纵深型 | Codex (OpenAI) | 开源,GPT 代码能力强,常用于 code review |
| IDE 型 | Cursor、Windsurf | 编码 IDE,Claude Code 之前流行 |
| 开源平替 | OpenCode | Claude Code 开源版,可配 DeepSeek |
| 横向型 | OpenClaw、Hermes | 自动化运营(WhatsApp、飞书等) |
纵深型做深度工程开发,横向型做自动化运营,两者不冲突。
工程师的能力转型
工程师永远不会失业,但码农可能会失业。
- 码农:单纯写代码的人 → 会被 Agent 替代
- 工程师:设计并驾驭复杂系统的人 → 不可替代
核心能力:理解系统复杂性 + 抽象和结构化思维 + 驾驭不确定性 + 深度业务理解
凡此过往,皆为序章。
本文基于黄佳在 Datawhale 的分享整理,原文详情请访问 Datawhale 公众号。