我感觉Vibe Coding已经到头了

这半个月以来，Claude Opus 4.7 的口碑急剧恶化。自从 OpenAI 发布 GPT-5.5 之后，舆论几乎一面倒，不管是国内还是国外社区，都是清一色地踩 Opus 4.7、捧 GPT-5.5。

Opus 4.7 的口碑滑铁卢

我观察下来，原因主要有两点。

第一，Opus 4.7 更换了新的分词器（tokenizer），导致很多原本调教得不错的 prompt 失去了以前的效果。第二，新分词器使得相同内容的 token 消耗量整体上升，用户更快触达额度上限，体感自然变差。

而新发布的 GPT-5.5 则反过来：输出质量更高、响应速度更快，更关键的是同档套餐下可用的额度比 Claude 多得多。

GPT-5.5 上线之后，Anthropic 一直在补救。先是发了一篇长文复盘”Claude 模型降智”的原因，结论指向两点：默认思考深度被悄悄下调，以及一个会导致输出质量下降的 bug。紧接着上周传出 Anthropic 与 SpaceX 达成合作，由后者提供 22 万颗 GPU 和配套电力支持。同一周 Anthropic 宣布 Claude 的 5 小时窗口额度翻倍（不过实际使用下来我并没有明显感受到翻倍），再到今天又宣布周限额上调 50%。

一系列动作背后，足以说明 GPT-5.5 给 Anthropic 带来了多大的压力。

Codex 与 Claude Code 的此消彼长

最近 OpenAI 也在大力打击廉价共享账号。那种几块钱一个月的 Plus 账号基本活不过一两天，所以 Codex 的使用成本和 Claude Code 已经基本持平，都是 20 / 100 / 200 美元三档。

但有一个关键差异：通过安卓或苹果商店内购支付时，Codex 维持原价，而 Claude 的 100 / 200 美元套餐需要额外承担 25% 的”苹果税 / 谷歌税”。换算下来，Claude Code 的实际成本是 125 / 250 美元，明显高出一截。

对于没有海外银行卡的开发者来说，这一点尤其要命，因为合规开通几乎只剩下应用内购买这一条路。

再叠加几个因素：

Codex 给出的配额更宽裕；
Claude 时不时传出封号事件，而 OpenAI 几乎没有听说过封禁正规渠道充值用户的情况；
最近 Codex 也补齐了 Computer Use、远程控制等能力，功能层面正在快速追平 Claude。

综合下来，Codex 在费用、额度和稳定性三个维度上都已经反超 Claude Code，两者的差距正在迅速消失。

我为什么感觉 Vibe Coding 已经到头了

前面铺垫了这么多，回到标题本身。

各大 AI 厂商都在涨价。曾经以高性价比著称的国产模型，比如 GLM、千问，乃至最近的豆包，都陆续宣布开始收费。对企业来说，批量采购 AI 是一笔可观的支出：便宜的模型能力差强人意，贵的又会让成本骤升。

一个尴尬的循环已经开始出现：企业以为有了 AI 就不再需要那么多人，于是裁员、大规模铺开 AI 工具；结果是员工工作量上升，而企业总成本不降反升，因为 AI 的开支甚至可能超过此前的人力开支。

更根本的原因是，目前的 AI 模型还没有走到”完全脱离人也能自行迭代产品”的那一步。最近几周我一直在认真尝试 Vibe Coding，下面是我亲身遇到的几个问题。

一、人力干预成本依然很高

正如前面所说，AI 还没有发展到能完全自主迭代的程度。它能放大个人生产力，但很难真正做到”并行处理两件事”，比如一边让 AI 跑任务，一边自己刷文档或学习。

我试过这种工作模式，结果是 AI 会频繁跳出来让你做抉择，或弹出权限询问。每一次打断都拉高了干预成本，你既学不进去东西，也看不完一个视频。

二、产品路线开始失控

随着生产力被放大，有时候反而想不出该做什么需求。于是干脆让 AI 帮你提需求。问题在于，AI 是把需求实现了，但最后到底加了哪些功能、走的是什么产品路线，自己其实并不完全清楚，产品层面已经失去把控。

三、测试环节没法完全交出去

功能实现和产品规划都可以一定程度上交给 AI，但测试目前还无法完全交出去。Computer Use 确实能跑一些 UX 测试、修复一些显式 bug，但远不能覆盖测试的全部场景，尤其是涉及业务边界条件和异常路径的部分。

四、同质化竞争来得太快

生产力的提升带来了一个副作用：只要一个产品爆火，几乎立刻会出现一大批模仿者，速度快到不可思议，可能不到一天，市面上就是一堆同质化产品。对独立开发者来说，这种环境极不友好。

五、公司场景下依然受限

在公司里，Vibe Coding 的可用场景同样有限。仅凭一份产品原型图就让 AI 完成版本迭代，目前仍然不现实，大部分关键决策还是要靠人来把控。

六、项目迁移仍需深度介入

我做过一次不算大的项目迁移：从 Vue 2 迁到 Vue 3。由于 Vue 3 包含破坏性更新，几乎每个文件都需要重写。

项目大概有七十多个页面，我让 AI 来执行迁移，写了非常多的提示词，结果是没有任何一次能在单个对话窗口里完整迁移完，必须分步骤推进。

这让我相当失望。我原本期待的场景是：写好一段提示词挂在那里，自己去做其它的然后 AI 自己就把 Vue 2 迁到了 Vue 3。现实显然还没到那一步。

结语：AI 是杠杆，不是替代品

经过这一轮实测，我对 AI 当下的定位看得更清楚了：它是一个辅助者，而不是一个替代者。

越熟练使用 AI 的人，机会越大；但寄希望于”AI 自己跑业务”的玩法，至少在 2026 年中这个时间点上，还不成立。

更值得关注的，是它作为”撬动认知杠杆”的工具属性：用它来学习、来扩展自己的知识边界，效率提升是数量级层面的。这或许才是当下使用 AI 最稳妥、也最有复利的方式。

Opus 4.7 的口碑滑铁卢

Codex 与 Claude Code 的此消彼长

我为什么感觉 Vibe Coding 已经到头了

一、人力干预成本依然很高

二、产品路线开始失控

三、测试环节没法完全交出去

四、同质化竞争来得太快

五、公司场景下依然受限

六、项目迁移仍需深度介入

结语：AI 是杠杆，不是替代品

转载协议

☕ 请我喝杯咖啡

未找到相关文章

Opus 4.7 的口碑滑铁卢

Codex 与 Claude Code 的此消彼长

我为什么感觉 Vibe Coding 已经到头了

一、人力干预成本依然很高

二、产品路线开始失控

三、测试环节没法完全交出去

四、同质化竞争来得太快

五、公司场景下依然受限

六、项目迁移仍需深度介入

结语：AI 是杠杆，不是替代品

转载协议

☕ 请我喝杯咖啡