Industry PerspectiveFuli Luo ([@_LuoFuli](https://x.com/_LuoFuli))April 5, 2026
View Original

Fuli Luo: Anthropic 切掉第三方 Harness 订阅 — 算力经济分析

原文: Tweet · Fuli Luo (@_LuoFuli) · April 5, 2026 Engagement: 1,770 likes · 222 retweets · 733K views 分类: Industry Perspective


Background

2026 年 4 月初,Anthropic 切断了第三方 harness(如 OpenClaw、OpenCode)使用 Claude 订阅的能力。几乎同时,MiMo 推出了 Token Plan。罗福莉(Fuli Luo)将这两件事放在一起分析,提出了对 Agent 时代算力经济的深度思考。


Core Arguments

1. Claude Code 订阅是精巧的算力分配设计

Claude Code 的订阅系统大概率不赚钱,甚至在流血。第三方 harness 接入后,真实成本可能是订阅价格的 数十倍

罗福莉分析了 OpenClaw 的上下文管理:在单次用户查询中,它会发起多轮低价值的 tool calls 作为独立 API 请求,每轮携带超过 100K tokens 的长上下文。即使有 cache hits,也很浪费;极端情况下还会推高其他查询的 cache miss rate。

2. 短期阵痛 → 长期工程纪律

第三方 harness 仍然可以通过 API 调用 Claude — 只是不能再搭便车订阅了。短期内用户成本跳涨数十倍。但这个压力正是推动 harness 改进上下文管理、最大化 prompt cache hit rate、减少无效 token 消耗的动力。

"Pain eventually converts to engineering discipline."

3. 不要在赔钱的定价上竞速

罗福莉呼吁 LLM 公司不要盲目打价格战。把 token 卖得很便宜又对第三方 harness 大开方便门,看起来对用户友好,但这是个陷阱 — 正是 Anthropic 刚走出来的陷阱。

更深层的问题:如果用户把注意力消耗在低质量的 agent harness、不稳定的推理服务、和降级模型上,最终什么都做不好 — 这对用户体验和留存率都是负循环。

4. 协同进化论

"The Agent era doesn't belong to whoever burns the most compute. It belongs to whoever uses it wisely."

全球算力跟不上 Agent 产生的 token 需求。真正的出路不是更便宜的 token,而是协同进化:

更高效的 Agent Harness  ×  更强大更高效的模型

Anthropic 的这步棋,无论是否有意为之,正在推动整个生态系统 — 开源和闭源 — 都朝着这个方向走。


为什么重要 for Harness Engineering

这篇分析揭示了 Harness Engineering 的一个经常被忽略的维度:效率

Harness 不只是要让 agent 能力更强、运行更久、协调更多 agent — 它还必须让 agent 更省。上下文管理的质量直接影响 API 成本,而 API 成本是 Agent 产品能否商业化的关键。

当模型提供商开始按照上下文效率来区分定价(或直接拒绝低效 harness),优化 harness 的 token 消耗就不再是可选项,而是生存问题。


See also: OpenAI: Harness Engineering · Anthropic: Multi-Agent Harness Design