小米罗福莉：给Token降价，不如把模型做好

2026-04-29 11:18

Anthropic Claude Code 负责人 Boris Cherny 在 X 上宣布，从 4 月 4 日下午 3 点（美东时间）起，Claude 订阅用户将无法再通过第三方 Agent 工具（包括 OpenClaw、OpenCode 等）消耗订阅额度。消息一出，AI 圈炸锅。

OpenClaw 创始人 Peter Steinberger 在 X 上发帖暗讽：" 时间点真巧，先把热门功能抄进自家封闭工具里，然后把开源锁在门外。"

但在争议声中，小米 MiMo 团队工程师，"天才少女"罗福莉发表了一条长帖，从推理成本和算力分配的角度给出了一个不同的判断：Anthropic 这一刀，可能是在帮整个生态做一件正确的事。

成本黑洞

这件事的核心矛盾其实很简单：包月订阅制和 Agent 的 token 消耗模式之间，存在一个巨大的成本缺口。

Anthropic Claude Code 负责人 Boris Cherny 给出的理由是算力压力：" 我们的订阅体系不是为这些第三方工具的使用模式设计的。算力是我们需要审慎管理的资源。"

增长营销专家 Aakash Gupta 算了一笔账：一个 OpenClaw Agent 跑一天，API 成本可能在 1000 到 5000 美元之间。而 Claude Pro 的月费是 20 美元，Max 是 100-200 美元。Anthropic 相当于在为每一个通过第三方接入的用户补贴数十倍的成本差额。

罗福莉的分析更具体。她在帖子中指出，她近距离研究过 OpenClaw 的上下文管理机制，评价是 " 很差 "。

在单次用户查询中，OpenClaw 会发起多轮低价值的工具调用，每次调用都作为独立 API 请求，且携带很长的上下文窗口（通常超过 10 万 token）。即使有缓存命中，这也是极大的浪费；在极端情况下，还会推高其他查询的缓存未命中率。

" 实际的请求次数最终是 Claude Code 自身框架的数倍。换算成 API 定价，真实成本大概是订阅价格的数十倍。" 罗福莉写道，" 这不是一个差距，这是一个坑。"

还有一个更隐蔽的问题：很多第三方 Agent 工具在接近上下文长度限制时，会每隔 3 步就压缩一次工具返回内容。这种频繁的压缩操作会导致上下文内容不断变化，使得 prompt 缓存几乎完全失效。缓存命中率极低，相当于每次请求都在从头计算。对于按缓存设计的推理基础设施来说，这种使用模式的成本是灾难性的。

Cherny 本人也透露，他曾亲自向 OpenClaw 提交了几个 PR（代码合并请求），试图帮助改善其 prompt 缓存命中率。这个细节说明 Anthropic 在做出封杀决定之前，确实尝试过技术层面的协调。

小米 MiMo 的不同选择

有意思的是，就在 Anthropic 宣布封杀的前三天，小米的 MiMo 刚刚推出了自己的 Token Plan。这是一个按 token 配额计费的方案，明确支持第三方 Agent 工具接入。

罗福莉在帖中表示，这与 Claude 新推出的 "Extra Usage" 套餐遵循相同的逻辑：按实际消耗收费，而不是用包月订阅覆盖无法预测的 Agent 用量。

" 因为我们追求的是长期稳定地交付高质量模型和服务，而不是让你冲动付费然后弃船。" 她写道。

她同时对整个行业发出警告：不要在还没搞清楚如何让 coding plan 不亏钱的情况下，就盲目打价格战。" 把 token 卖得特别便宜，同时对第三方 Agent 工具大开方便之门，看起来对用户友好，但这是一个陷阱——和 Anthropic 刚刚走出来的是同一个陷阱。"

如果用户把注意力消耗在低质量的 Agent 工具、高度不稳定的推理服务、以及为降低成本而降级的模型上，最终发现什么都做不成。这对用户体验和留存都不是一个健康的循环。

开源社区的痛感

对于依赖 Claude 订阅驱动 OpenClaw 的个人开发者和小团队来说，这个变化的冲击是立竿见影的。

一位开发者在 X 上回复 Cherny：" 如果我把两个 OpenClaw 实例都切换到 API 或你推荐的 Extra Usage，成本会高到不值得继续用。我可能不得不换到其他模型了。"

OpenClaw 创始人则称，他和投资人 Dave Morin 曾试图与 Anthropic 沟通，但只争取到了一周的延期。他对 Anthropic 的 " 算力 " 说辞持怀疑态度，认为真正的动机是商业竞争，因为 Anthropic 近期刚刚为 Claude Code 添加了通过 Discord 和 Telegram 发送消息等功能，这些正是 OpenClaw 此前的热门功能。

这种 " 先模仿、再封杀 " 的指控在开源社区引起了广泛共鸣。但从纯商业角度看，Anthropic 的逻辑也不难理解：作为一家估值 3800 亿美元、仍在大规模烧钱的 AI 公司，持续为第三方工具补贴数十倍的计算成本，在财务上是不可持续的。

算力效率才是正途

帖文末尾，罗福莉给出了她的判断：

" 全球算力产能跟不上 Agent 正在创造的 token 需求。真正的出路不是更便宜的 token，而是协同进化—— ' 更省 token 的 Agent 工具 ' 乘以 ' 更强大和高效的模型 '。"

"Anthropic 的这一步，不管他们是否有意为之，正在推动整个生态——开源和闭源——朝着这个方向走。这大概是一件好事。Agent 时代不属于谁烧掉最多算力，而属于谁用得最聪明。"

这个观点揭示了 AI Agent 领域一个正在浮现的结构性矛盾：Agent 的能力在爆发式增长，但 Agent 的资源效率并没有同步提升。

OpenClaw 的流行恰恰暴露了这一点，它让用户尝到了自主 Agent 的甜头，但它消耗算力的方式是粗放的。当 Anthropic 为这种粗放买单时，问题被掩盖了；当 Anthropic 停止买单，问题暴露了。

从这个角度看，Anthropic 的封杀与其说是一次商业决策，不如说是给整个 Agent 生态发出了一个信号：免费的算力午餐结束了，是时候认真优化了。（AI 普瑞斯）