小米罗福莉:给Token降价,不如把模型做好
Anthropic Claude Code 负责人 Boris Cherny 在 X 上宣布,从 4 月 4 日下午 3 点(美东时间)起,Claude 订阅用户将无法再通过第三方 Agent 工具(包括 OpenClaw、OpenCode 等)消耗订阅额度。消息一出,AI 圈炸锅。 OpenClaw 创始人 Peter Steinberger 在 X 上发帖暗讽:" 时间点真巧,先把热门功能抄进自家封闭工具里,然后把开源锁在门外。" 但在争议声中,小米 MiMo 团队工程师,"天才少女"罗福...
Anthropic Claude Code 负责人 Boris Cherny 在 X 上宣布,从 4 月 4 日下午 3 点(美东时间)起,Claude 订阅用户将无法再通过第三方 Agent 工具(包括 OpenClaw、OpenCode 等)消耗订阅额度。消息一出,AI 圈炸锅。
OpenClaw 创始人 Peter Steinberger 在 X 上发帖暗讽:" 时间点真巧,先把热门功能抄进自家封闭工具里,然后把开源锁在门外。"

但在争议声中,小米 MiMo 团队工程师,"天才少女"罗福莉发表了一条长帖,从推理成本和算力分配的角度给出了一个不同的判断:Anthropic 这一刀,可能是在帮整个生态做一件正确的事。
成本黑洞
这件事的核心矛盾其实很简单:包月订阅制和 Agent 的 token 消耗模式之间,存在一个巨大的成本缺口。
Anthropic Claude Code 负责人 Boris Cherny 给出的理由是算力压力:" 我们的订阅体系不是为这些第三方工具的使用模式设计的。算力是我们需要审慎管理的资源。"
增长营销专家 Aakash Gupta 算了一笔账:一个 OpenClaw Agent 跑一天,API 成本可能在 1000 到 5000 美元之间。而 Claude Pro 的月费是 20 美元,Max 是 100-200 美元。Anthropic 相当于在为每一个通过第三方接入的用户补贴数十倍的成本差额。

罗福莉的分析更具体。她在帖子中指出,她近距离研究过 OpenClaw 的上下文管理机制,评价是 " 很差 "。
在单次用户查询中,OpenClaw 会发起多轮低价值的工具调用,每次调用都作为独立 API 请求,且携带很长的上下文窗口(通常超过 10 万 token)。即使有缓存命中,这也是极大的浪费;在极端情况下,还会推高其他查询的缓存未命中率。

" 实际的请求次数最终是 Claude Code 自身框架的数倍。换算成 API 定价,真实成本大概是订阅价格的数十倍。" 罗福莉写道," 这不是一个差距,这是一个坑。"
还有一个更隐蔽的问题:很多第三方 Agent 工具在接近上下文长度限制时,会每隔 3 步就压缩一次工具返回内容。这种频繁的压缩操作会导致上下文内容不断变化,使得 prompt 缓存几乎完全失效。缓存命中率极低,相当于每次请求都在从头计算。对于按缓存设计的推理基础设施来说,这种使用模式的成本是灾难性的。
Cherny 本人也透露,他曾亲自向 OpenClaw 提交了几个 PR(代码合并请求),试图帮助改善其 prompt 缓存命中率。这个细节说明 Anthropic 在做出封杀决定之前,确实尝试过技术层面的协调。

小米 MiMo 的不同选择
有意思的是,就在 Anthropic 宣布封杀的前三天,小米的 MiMo 刚刚推出了自己的 Token Plan。这是一个按 token 配额计费的方案,明确支持第三方 Agent 工具接入。
罗福莉在帖中表示,这与 Claude 新推出的 "Extra Usage" 套餐遵循相同的逻辑:按实际消耗收费,而不是用包月订阅覆盖无法预测的 Agent 用量。
" 因为我们追求的是长期稳定地交付高质量模型和服务,而不是让你冲动付费然后弃船。" 她写道。

她同时对整个行业发出警告:不要在还没搞清楚如何让 coding plan 不亏钱的情况下,就盲目打价格战。" 把 token 卖得特别便宜,同时对第三方 Agent 工具大开方便之门,看起来对用户友好,但这是一个陷阱——和 Anthropic 刚刚走出来的是同一个陷阱。"
如果用户把注意力消耗在低质量的 Agent 工具、高度不稳定的推理服务、以及为降低成本而降级的模型上,最终发现什么都做不成。这对用户体验和留存都不是一个健康的循环。
开源社区的痛感
对于依赖 Claude 订阅驱动 OpenClaw 的个人开发者和小团队来说,这个变化的冲击是立竿见影的。
一位开发者在 X 上回复 Cherny:" 如果我把两个 OpenClaw 实例都切换到 API 或你推荐的 Extra Usage,成本会高到不值得继续用。我可能不得不换到其他模型了。"

OpenClaw 创始人则称,他和投资人 Dave Morin 曾试图与 Anthropic 沟通,但只争取到了一周的延期。他对 Anthropic 的 " 算力 " 说辞持怀疑态度,认为真正的动机是商业竞争,因为 Anthropic 近期刚刚为 Claude Code 添加了通过 Discord 和 Telegram 发送消息等功能,这些正是 OpenClaw 此前的热门功能。
这种 " 先模仿、再封杀 " 的指控在开源社区引起了广泛共鸣。但从纯商业角度看,Anthropic 的逻辑也不难理解:作为一家估值 3800 亿美元、仍在大规模烧钱的 AI 公司,持续为第三方工具补贴数十倍的计算成本,在财务上是不可持续的。
算力效率才是正途
帖文末尾,罗福莉给出了她的判断:
" 全球算力产能跟不上 Agent 正在创造的 token 需求。真正的出路不是更便宜的 token,而是协同进化—— ' 更省 token 的 Agent 工具 ' 乘以 ' 更强大和高效的模型 '。"

"Anthropic 的这一步,不管他们是否有意为之,正在推动整个生态——开源和闭源——朝着这个方向走。这大概是一件好事。Agent 时代不属于谁烧掉最多算力,而属于谁用得最聪明。"
这个观点揭示了 AI Agent 领域一个正在浮现的结构性矛盾:Agent 的能力在爆发式增长,但 Agent 的资源效率并没有同步提升。
OpenClaw 的流行恰恰暴露了这一点,它让用户尝到了自主 Agent 的甜头,但它消耗算力的方式是粗放的。当 Anthropic 为这种粗放买单时,问题被掩盖了;当 Anthropic 停止买单,问题暴露了。
从这个角度看,Anthropic 的封杀与其说是一次商业决策,不如说是给整个 Agent 生态发出了一个信号:免费的算力午餐结束了,是时候认真优化了。(AI 普瑞斯)

