我感觉Vibe Coding已经到头了
这半个月以来,Claude Opus 4.7 的口碑急剧恶化。自从 OpenAI 发布 GPT-5.5 之后,舆论几乎一面倒,不管是国内还是国外社区,都是清一色地踩 Opus 4.7、捧 GPT-5.5。
Opus 4.7 的口碑滑铁卢
我观察下来,原因主要有两点。
第一,Opus 4.7 更换了新的分词器(tokenizer),导致很多原本调教得不错的 prompt 失去了以前的效果。第二,新分词器使得相同内容的 token 消耗量整体上升,用户更快触达额度上限,体感自然变差。
而新发布的 GPT-5.5 则反过来:输出质量更高、响应速度更快,更关键的是同档套餐下可用的额度比 Claude 多得多。
GPT-5.5 上线之后,Anthropic 一直在补救。先是发了一篇长文复盘”Claude 模型降智”的原因,结论指向两点:默认思考深度被悄悄下调,以及一个会导致输出质量下降的 bug。紧接着上周传出 Anthropic 与 SpaceX 达成合作,由后者提供 22 万颗 GPU 和配套电力支持。同一周 Anthropic 宣布 Claude 的 5 小时窗口额度翻倍(不过实际使用下来我并没有明显感受到翻倍),再到今天又宣布周限额上调 50%。
一系列动作背后,足以说明 GPT-5.5 给 Anthropic 带来了多大的压力。
Codex 与 Claude Code 的此消彼长
最近 OpenAI 也在大力打击廉价共享账号。那种几块钱一个月的 Plus 账号基本活不过一两天,所以 Codex 的使用成本和 Claude Code 已经基本持平,都是 20 / 100 / 200 美元三档。
但有一个关键差异:通过安卓或苹果商店内购支付时,Codex 维持原价,而 Claude 的 100 / 200 美元套餐需要额外承担 25% 的”苹果税 / 谷歌税”。换算下来,Claude Code 的实际成本是 125 / 250 美元,明显高出一截。
对于没有海外银行卡的开发者来说,这一点尤其要命,因为合规开通几乎只剩下应用内购买这一条路。
再叠加几个因素:
- Codex 给出的配额更宽裕;
- Claude 时不时传出封号事件,而 OpenAI 几乎没有听说过封禁正规渠道充值用户的情况;
- 最近 Codex 也补齐了 Computer Use、远程控制等能力,功能层面正在快速追平 Claude。
综合下来,Codex 在费用、额度和稳定性三个维度上都已经反超 Claude Code,两者的差距正在迅速消失。
我为什么感觉 Vibe Coding 已经到头了
前面铺垫了这么多,回到标题本身。
各大 AI 厂商都在涨价。曾经以高性价比著称的国产模型,比如 GLM、千问,乃至最近的豆包,都陆续宣布开始收费。对企业来说,批量采购 AI 是一笔可观的支出:便宜的模型能力差强人意,贵的又会让成本骤升。
一个尴尬的循环已经开始出现:企业以为有了 AI 就不再需要那么多人,于是裁员、大规模铺开 AI 工具;结果是员工工作量上升,而企业总成本不降反升,因为 AI 的开支甚至可能超过此前的人力开支。
更根本的原因是,目前的 AI 模型还没有走到”完全脱离人也能自行迭代产品”的那一步。最近几周我一直在认真尝试 Vibe Coding,下面是我亲身遇到的几个问题。
一、人力干预成本依然很高
正如前面所说,AI 还没有发展到能完全自主迭代的程度。它能放大个人生产力,但很难真正做到”并行处理两件事”,比如一边让 AI 跑任务,一边自己刷文档或学习。
我试过这种工作模式,结果是 AI 会频繁跳出来让你做抉择,或弹出权限询问。每一次打断都拉高了干预成本,你既学不进去东西,也看不完一个视频。
二、产品路线开始失控
随着生产力被放大,有时候反而想不出该做什么需求。于是干脆让 AI 帮你提需求。问题在于,AI 是把需求实现了,但最后到底加了哪些功能、走的是什么产品路线,自己其实并不完全清楚,产品层面已经失去把控。
三、测试环节没法完全交出去
功能实现和产品规划都可以一定程度上交给 AI,但测试目前还无法完全交出去。Computer Use 确实能跑一些 UX 测试、修复一些显式 bug,但远不能覆盖测试的全部场景,尤其是涉及业务边界条件和异常路径的部分。
四、同质化竞争来得太快
生产力的提升带来了一个副作用:只要一个产品爆火,几乎立刻会出现一大批模仿者,速度快到不可思议,可能不到一天,市面上就是一堆同质化产品。对独立开发者来说,这种环境极不友好。
五、公司场景下依然受限
在公司里,Vibe Coding 的可用场景同样有限。仅凭一份产品原型图就让 AI 完成版本迭代,目前仍然不现实,大部分关键决策还是要靠人来把控。
六、项目迁移仍需深度介入
我做过一次不算大的项目迁移:从 Vue 2 迁到 Vue 3。由于 Vue 3 包含破坏性更新,几乎每个文件都需要重写。
项目大概有七十多个页面,我让 AI 来执行迁移,写了非常多的提示词,结果是没有任何一次能在单个对话窗口里完整迁移完,必须分步骤推进。
这让我相当失望。我原本期待的场景是:写好一段提示词挂在那里,自己去做其它的然后 AI 自己就把 Vue 2 迁到了 Vue 3。现实显然还没到那一步。
结语:AI 是杠杆,不是替代品
经过这一轮实测,我对 AI 当下的定位看得更清楚了:它是一个辅助者,而不是一个替代者。
越熟练使用 AI 的人,机会越大;但寄希望于”AI 自己跑业务”的玩法,至少在 2026 年中这个时间点上,还不成立。
更值得关注的,是它作为”撬动认知杠杆”的工具属性:用它来学习、来扩展自己的知识边界,效率提升是数量级层面的。这或许才是当下使用 AI 最稳妥、也最有复利的方式。
转载协议
本文采用 CC BY-NC-SA 4.0 协议进行许可,转载请注明出处。 CC BY-NC-SA 4.0
允许转载、修改和分享,但必须注明作者和出处,且不得用于商业用途,衍生作品需采用相同协议。
☕ 请我喝杯咖啡
如果这篇文章对你有帮助,欢迎打赏支持!