强烈推荐你们去看一期分享,是前两天字节技术副总洪定坤在Force大会上讲的关于AI Coding的实践。
有空的话一定要去看原文,启发很大。
我今年4月份的时候就发过一篇笔记,当时那篇笔记在感叹,SOLO独立端居然有93%的代码都是AI写的,简直恐怖。
到了现在6月份,他们TRAE团队又公布了新的官方数据:在过去半年时间里,他们超过 90% 的代码都是 AI 写的。
按常理推算,AI 写代码的速度是人的十倍以上,九成代码交给机器,效率应该翻好几倍才对。但真实的数据是:人均需求吞吐率仅提升了 60%。
这很反常,十倍速的生产力注入,最后只换来 1.6 倍的产出?中间那些消失的效率去了哪里呢?
1在过去一年,字节 AI 代码贡献率增长了 6 倍多,AI Coding 的 tokens 消耗涨了 5 倍,代码合入率也翻了 2 倍。从数字层面看,简直是教科书级的 AI 落地样本。
但洪定坤说:这些数字不代表我们做得好。
AI 代码贡献率这个指标,衡量的是一个中间过程,而非最终结果。它告诉你 AI 参与了多少,但不告诉你交付效率有没有真的提高、产品质量有没有受影响、整体研发周期有没有缩短。
更糟糕的是,洪定坤提到,字节内部有些团队把 AI 代码贡献率当成了 KPI,围绕着这一个数字去优化
我们需要的不是一把量代码数量的尺子,而是一把量交付质量和全局效率的尺子。
2Vibe Coding 这个词过去两年很火,描述的是一种非常轻快的开发方式,整个过程像聊天一样自然,速度也确实很快。
但洪定坤在演讲里对Vibe Coding的形容是:感觉快了,可能慢了。
他们团队做了一个很有意思的实验,以豆包一个即将上线的真实功能需求作为测试案例,需求是让用户在创作页面里创作视频然后做预览和调整。
他们选了 3 个主流的 Coding 模型和 3 个主流的 Agent 框架,两两组合,每种组合用相同的 Prompt 跑了 100 次,总计 900 次。
第一列看功能正确率:所有组合都超过了 80%,看起来相当不错。但看后面几列:UI 易用性、交互可行性、可靠性、可维护性、性能、兼容性。
所有组合在这些维度上都出现了大幅下降,而且表现出极强的随机性。
如果拿真实上线标准来衡量,这些跑出来的代码没有一组能直接交付。
所以你看,在真实的软件工程里,把功能写对只是冰山一角。代码要放进已有的架构里,要和其他模块配合,要考虑异常处理、性能、安全、可维护性。
这些东西 Vibe Coding 天然不擅长,因为它的核心逻辑就是快速试错,而不是系统思考。
3那有没有解决方案呢?洪定坤用了一个词:Harness。
这个词今年很热,很多人一听到就想到 Agent 框架、工具调用能力,但他认为真正重要的 Harness 是更基础的东西,他管它叫基建。
当他们把这些基建补上之后,用同样的 9 种模型加框架组合重新跑了一遍,功能正确率从 80% 左右提升到了接近 90%,这个变化不算特别大。
但显著的变化在另一个维度,就是那些软件工程层面的可交付性指标,从之前普遍 40 到 60 分的不及格水平,跳到了 80 分。
同样的模型,同样的框架,同样的提示词,唯一的变量是底下那层不起眼的基建。
4洪定坤在演讲了还分享了一个故事。
前段时间,有个产品同学找到他,说自己有个需求,已经用 Vibe Coding 做出来了。然后她去找研发同事,说这个功能我做好了,能不能给我代码仓库的权限,我自己提交上线?
研发的回答是:这个需求还是要排期,可能还要几天。产品同学很不理解,代码已经能跑了,为什么不能直接上线?
后来他们认真看了这段代码,发现虽然功能确实能用,但性能不够好,扩展性没考虑,还有权限安全的问题。
这个故事很能说明当前的困境。一方面,AI 让更多角色能直接产出代码,这本身是好事,沟通更直接,验证更快。但另一方面,代码生成的门槛降低了,不代表系统复杂度也降低了。
真实业务的代码要融入既有架构,要和已有模块配合,要通过安全审查,要考虑线上稳定性,所以不能说谁写出来谁就直接上线。
洪定坤认为真正的挑战,不是争论谁有资格写代码,而是怎么让不同角色更合理地参与进来。每个人都能发挥价值,但产出要进入统一的架构、规范和交付流程。
5洪定坤也在这场演讲里,聊到了他们内部的实践方向。
比如他们内部的一个实践方向,叫原型驱动的开发模式。过去是文档驱动,产品先写 PRD,设计画图,研发写技术方案,然后才开始写代码。
现在因为 AI 让制作原型的成本大幅下降了,团队可以先快速做出一个可交互的原型。这个原型不是静态的设计稿,而是真的可以点击、可以操作,然后围绕这个动态的原型去讨论、去体验,把共识在最早期就对齐。
除了原型驱动,他们还在推一件事叫系统化 AI Development。
通俗来说,就是不只让 AI 写代码这一个环节,而是让 AI 嵌入到研发的各个流程里去。编写 Spec、自动打开浏览器验证功能、发现 Bug 自动修复、确认无误后自动提交发布。让整条链路都被 AI 覆盖到,而不是只有中间写代码那一段。
最后是组织化建设。洪定坤观察到,早期 AI Coding 的效率提升往往集中在少数高水平个体身上。组织需要的是把这些实践沉淀下来,变成标准、工具和技能,让整个团队的能力水位一起上升。字节的做法是把很多内部积累的能力直接沉淀到 TRAE 里,开放给所有工程师共同使用和共创。
AI Coding 毫无疑问正在改变软件开发,但它改变的方式,可能不是很多人想象中那种简单的加速。
它更像是往一个复杂系统里注入了一种新的能量,这种能量是好是坏,取决于系统本身有没有准备好去承接它。AI Coding 不只是一个技术问题,是一个关于人和组织如何适应新工具的问题。但适应这件事,并不简单。