OpenClaw爆火背后的真问题：Agent狂飙，但谁来踩刹车？-人工智能专区

OpenClaw爆火背后的真问题：Agent狂飙，但谁来踩刹车？

作者：卢敏编辑：卢敏 2026-03-12 15:26 IT168网站原创

　　一台Mac mini，16个AI员工，每月400美元“工资”——18岁创业者Vadim的数字公司正在社交媒体上疯狂刷屏。

　　但与此同时，另一个场景也在上演：有开发者让Agent帮忙处理工作，结果它把电脑上的所有数据删了个干净；有人让AI分析网页接口，它直接把线上评论全部清空；还有人发现，自己部署的OpenClaw控制台正裸奔在公网上，任何人都能围观。

　　2026年，OpenClaw无疑是AI圈最炙手可热的名字。它让“一人公司”从概念变为现实，也让“AI失控”从科幻走进日常。

　　当Agent开始像人类一样操作电脑、编写代码、协作办公，我们面临的真正问题是什么？是技术还不够强大，还是我们还没学会如何与“数字员工”相处？

　　门槛幻觉：为什么你的龙虾只会卖萌，别人的却能干活？

　　“OpenClaw并不像许多公众号描述的那样是一个低门槛产品。”

　　当网易CodeWave技术负责人姜天意说出这句话时，他刚刚分享完自己如何为OpenClaw搭建探针系统、自动备份配置文件、引入记忆管理框架来降低Token消耗的经历。

　　这揭示了一个残酷现实：在社交媒体上刷屏的那些“AI员工军团”，背后是大量普通人看不见的技术投入。

　　OpenClaw的走红有其必然。它抓住了一个关键痛点：将桌面Agent与聊天工具打通。用户只需通过IM对话，就能驱动Agent执行复杂任务——收集信息、分析数据、自动发帖、甚至编写代码。对于自媒体从业者、独立开发者和“一人公司”创业者来说，这几乎是量身定制的生产力工具。

　　但“开箱即用”只是幻觉。要真正让Agent稳定工作，你需要熟悉JSON配置、具备排障能力、持续调试和优化skill。配置文件中一个参数错误，可能导致整个系统崩溃；浏览器访问稳定性问题需要专门处理；Token消耗快得惊人，必须引入记忆管理框架。

　　“它并不像许多公众号描述的那样是一个低门槛产品。”姜天意强调，“对普通用户仍存在相当门槛。”

　　平安科技高级专家褚秋实则分享了更惊险的体验。他让AI通过Chrome Use打开浏览器，分析某个页面加载了哪些接口。由于指令不够清晰，AI理解为需要研究这些API的作用，直接调用了接口——其中有些是删除接口，最终把他评论平台上的内容全部删光。

　　“所以很多人会专门找一台旧电脑或购置一台Mac mini来运行这些Agent。”他说。

　　这引出了一个更深层的问题：当Agent获得操作电脑的权限，如何确保它的行为符合人类意图？传统的RBAC权限模型已经不够用，未来可能需要增加“意图层”的控制——AI虽已获得授权，系统还需根据其具体意图进行进一步验证。

　　AI Coding的最大问题不是生成，而是失控

　　“第一批Vibe Coding的受害者已经出现了。”褚秋实半开玩笑地说。

　　所谓Vibe Coding，指的是通过自然语言与AI对话，让它不断生成和修改代码的开发方式。这种方式让不懂技术的人也能快速搭建应用，但也催生了一个新职业：“Vibe Coding治疗师”——专门修复AI生成的屎山代码。

　　当讨论从个人使用延伸到团队协作，AI Coding的真正挑战浮出水面。

　　“核心问题在于AI生成代码的不稳定与不可控。”姜天意直言。主要体现在三个方面：一是需求理解偏差，自然语言的模糊性对AI而言歧义更多；二是生成的技术栈与团队现有体系不一致，很多模型主要使用国外主流技术栈训练，对企业内部私有框架支持较弱；三是代码的可维护性差，团队往往不再认真阅读AI写出的代码，只要功能达到预期便通过。

　　一个典型案例：团队想开发一个在线截图工具，按常规思路只需启动无头浏览器执行截图。但AI直接用curl请求调用了第三方截图API，功能虽然实现，却完全不是想要的方案。

　　这正是AI Coding中“可控性”问题的缩影。

　　为此，一种名为“SPEC Driven”的开发方法正在大厂内部快速推广。核心思路是：在需求理解阶段通过SPEC将需求结构化，再转化为技术设计，供架构师评审技术栈、方案和接口是否合理，之后才进入逐步执行阶段。这样可以在一定程度上保证AI coding在可控框架内落地。

　　“很多传统软件工程方法在AI时代反而更具价值。”姜天意说。例如BDD可以在需求阶段就定义测试行为，使测试尽可能前移；SPEC driven方法也可以通过SPEC自动生成TDD测试。AI出现之前，开发人员通常不太愿意编写测试用例；而现在，TDD、BDD等工作可以交由AI完成。

　　但褚秋实提出了更深层的担忧：“TDD的核心不仅是写测试，而是设计能力。如果代码本身不可测试，再好的工具也难以发挥作用。”

　　在他看来，AI时代对代码质量的要求不是降低了，而是更高了。过去很多系统功能运行正常，代码结构却混乱。在这种情况下引入AI，风险其实更大——因为大模型是直接基于代码库生成代码，如果代码库本身混乱，AI就很难遵循统一规范。

　　“因此在AI时代，代码组织方式和结构一致性的重要性会被进一步放大。”

　　未来组织：当每个人都带着一支“AI团队”

　　“我不会去招一个独立的开发者或文案，”18岁的Vadim在采访中说，“我会去招一个已经有自己OpenClaw团队的人，把他整套Agent系统并入我的公司。”

　　这句听起来像科幻小说的话，正在成为一些技术团队的现实考量。

　　在网易，SPEC driven已经成为大规模落地的研发理念。“我们的大老板提出了SPEC先行的概念，所有软件开发任务都应该从SPEC开始。”姜天意透露，“目前网易几乎所有事业部都在尝试大规模落地这一理念。”

　　实践形式不限于特定工具，也有团队采用BDD思路，或者通过plan mode加上严格的团队流程约束来实现类似效果。“推广的根本原因在于，大家发现它能解决Vibe Coding中不可控的问题。”

　　平安科技则在尝试将AI开发过程中的经验沉淀为团队共享记忆。每次成功解决问题的对话，都会被总结成Markdown文档归档。第一次开发某个功能时可能需要大量人机协作，但当这些经验被归档后，下次开发类似功能时AI的准确率就会明显提高。

　　“随着规范积累到一定程度，规范驱动开发也会逐渐呈现出类似Vibe Coding的效率体验。”褚秋实说。

　　这指向了一个更深远的变革：AI不是在取代程序员，而是在重塑团队的知识管理方式和协作模式。

　　过去，代码规范停留在Markdown文档中，靠人来记忆和执行。现在，规范可以被转化为AI可理解的形式，嵌入开发流程。过去，隐性知识随着老员工离职而流失。现在，AI可以持续总结每个功能模块，使整个项目逐渐形成可理解的知识体系。

　　“要想真正放飞效率，必须先打好基础。”褚秋实总结，“在开发过程中，不仅要完成业务功能，还要为代码库留下知识和规范。”

　　淘宝闪购高级技术专家邓立山则看到了更远的未来：“从自动化角度来看，AI Coding未来会朝着更高的自动化程度发展。类似OpenClaw的系统，不再局限于单个应用或IDE插件，而是在更高层级协调多个系统。”

　　他描绘了这样一个场景：AI接收到需求后，直接将任务拆分给各个微服务，每个微服务自动完成本模块的分析、设计和编码，再结合反思机制循环生成、检查和修复代码，接着自动完成集成测试并在发现问题时继续修复。

　　“整个研发流程将会变得更加自动化和智能化。”

　　结语

　　回到那个18岁创业者的故事。他的16个AI员工每月“工资”400美元，在他睡觉时依然工作，已经帮他吸引了450多个用户，甚至带来了付费订单。

　　但这个故事的另一面是：有人因为AI误操作删光了数据，有人因为配置不当把控制台暴露在公网，有人在为AI生成的屎山代码焦头烂额。

　　OpenClaw的走红，不只是技术演进的自然结果，更是一个信号：Agent能力已经到达某个临界点，开始从实验室走向真实场景。但技术越强大，驾驭它所需的能力门槛就越高。

　　正如姜天意所说：“团队决策者需要具备判断能力，能够根据应用规模、复杂度和风险来确定AI生成代码的边界，以及如何验证生成结果。否则可能出现这样的问题：过去是人类开发者制造屎山代码，现在则变成AI批量制造屎山代码。”

　　Agent狂飙的时代已经到来。但决定它能跑多远的，或许不是技术本身，而是我们能否为它装上可靠的刹车。

关注我们