人工智能 频道

OpenClaw爆火背后的真问题:Agent狂飙,但谁来踩刹车?

  一台Mac mini,16个AI员工,每月400美元“工资”——18岁创业者Vadim的数字公司正在社交媒体上疯狂刷屏。

  但与此同时,另一个场景也在上演:有开发者让Agent帮忙处理工作,结果它把电脑上的所有数据删了个干净;有人让AI分析网页接口,它直接把线上评论全部清空;还有人发现,自己部署的OpenClaw控制台正裸奔在公网上,任何人都能围观。

  2026年,OpenClaw无疑是AI圈最炙手可热的名字。它让“一人公司”从概念变为现实,也让“AI失控”从科幻走进日常。

  当Agent开始像人类一样操作电脑、编写代码、协作办公,我们面临的真正问题是什么?是技术还不够强大,还是我们还没学会如何与“数字员工”相处?

  门槛幻觉:为什么你的龙虾只会卖萌,别人的却能干活?

  “OpenClaw并不像许多公众号描述的那样是一个低门槛产品。”

  当网易CodeWave技术负责人姜天意说出这句话时,他刚刚分享完自己如何为OpenClaw搭建探针系统、自动备份配置文件、引入记忆管理框架来降低Token消耗的经历。

  这揭示了一个残酷现实:在社交媒体上刷屏的那些“AI员工军团”,背后是大量普通人看不见的技术投入。

  OpenClaw的走红有其必然。它抓住了一个关键痛点:将桌面Agent与聊天工具打通。用户只需通过IM对话,就能驱动Agent执行复杂任务——收集信息、分析数据、自动发帖、甚至编写代码。对于自媒体从业者、独立开发者和“一人公司”创业者来说,这几乎是量身定制的生产力工具。

  但“开箱即用”只是幻觉。要真正让Agent稳定工作,你需要熟悉JSON配置、具备排障能力、持续调试和优化skill。配置文件中一个参数错误,可能导致整个系统崩溃;浏览器访问稳定性问题需要专门处理;Token消耗快得惊人,必须引入记忆管理框架。

  “它并不像许多公众号描述的那样是一个低门槛产品。”姜天意强调,“对普通用户仍存在相当门槛。”

  平安科技高级专家褚秋实则分享了更惊险的体验。他让AI通过Chrome Use打开浏览器,分析某个页面加载了哪些接口。由于指令不够清晰,AI理解为需要研究这些API的作用,直接调用了接口——其中有些是删除接口,最终把他评论平台上的内容全部删光。

  “所以很多人会专门找一台旧电脑或购置一台Mac mini来运行这些Agent。”他说。

  这引出了一个更深层的问题:当Agent获得操作电脑的权限,如何确保它的行为符合人类意图?传统的RBAC权限模型已经不够用,未来可能需要增加“意图层”的控制——AI虽已获得授权,系统还需根据其具体意图进行进一步验证。

  AI Coding的最大问题不是生成,而是失控

  “第一批Vibe Coding的受害者已经出现了。”褚秋实半开玩笑地说。

  所谓Vibe Coding,指的是通过自然语言与AI对话,让它不断生成和修改代码的开发方式。这种方式让不懂技术的人也能快速搭建应用,但也催生了一个新职业:“Vibe Coding治疗师”——专门修复AI生成的屎山代码。

  当讨论从个人使用延伸到团队协作,AI Coding的真正挑战浮出水面。

  “核心问题在于AI生成代码的不稳定与不可控。”姜天意直言。主要体现在三个方面:一是需求理解偏差,自然语言的模糊性对AI而言歧义更多;二是生成的技术栈与团队现有体系不一致,很多模型主要使用国外主流技术栈训练,对企业内部私有框架支持较弱;三是代码的可维护性差,团队往往不再认真阅读AI写出的代码,只要功能达到预期便通过。

  一个典型案例:团队想开发一个在线截图工具,按常规思路只需启动无头浏览器执行截图。但AI直接用curl请求调用了第三方截图API,功能虽然实现,却完全不是想要的方案。

  这正是AI Coding中“可控性”问题的缩影。

  为此,一种名为“SPEC Driven”的开发方法正在大厂内部快速推广。核心思路是:在需求理解阶段通过SPEC将需求结构化,再转化为技术设计,供架构师评审技术栈、方案和接口是否合理,之后才进入逐步执行阶段。这样可以在一定程度上保证AI coding在可控框架内落地。

  “很多传统软件工程方法在AI时代反而更具价值。”姜天意说。例如BDD可以在需求阶段就定义测试行为,使测试尽可能前移;SPEC driven方法也可以通过SPEC自动生成TDD测试。AI出现之前,开发人员通常不太愿意编写测试用例;而现在,TDD、BDD等工作可以交由AI完成。

  但褚秋实提出了更深层的担忧:“TDD的核心不仅是写测试,而是设计能力。如果代码本身不可测试,再好的工具也难以发挥作用。”

  在他看来,AI时代对代码质量的要求不是降低了,而是更高了。过去很多系统功能运行正常,代码结构却混乱。在这种情况下引入AI,风险其实更大——因为大模型是直接基于代码库生成代码,如果代码库本身混乱,AI就很难遵循统一规范。

  “因此在AI时代,代码组织方式和结构一致性的重要性会被进一步放大。”

  未来组织:当每个人都带着一支“AI团队”

  “我不会去招一个独立的开发者或文案,”18岁的Vadim在采访中说,“我会去招一个已经有自己OpenClaw团队的人,把他整套Agent系统并入我的公司。”

  这句听起来像科幻小说的话,正在成为一些技术团队的现实考量。

  在网易,SPEC driven已经成为大规模落地的研发理念。“我们的大老板提出了SPEC先行的概念,所有软件开发任务都应该从SPEC开始。”姜天意透露,“目前网易几乎所有事业部都在尝试大规模落地这一理念。”

  实践形式不限于特定工具,也有团队采用BDD思路,或者通过plan mode加上严格的团队流程约束来实现类似效果。“推广的根本原因在于,大家发现它能解决Vibe Coding中不可控的问题。”

  平安科技则在尝试将AI开发过程中的经验沉淀为团队共享记忆。每次成功解决问题的对话,都会被总结成Markdown文档归档。第一次开发某个功能时可能需要大量人机协作,但当这些经验被归档后,下次开发类似功能时AI的准确率就会明显提高。

  “随着规范积累到一定程度,规范驱动开发也会逐渐呈现出类似Vibe Coding的效率体验。”褚秋实说。

  这指向了一个更深远的变革:AI不是在取代程序员,而是在重塑团队的知识管理方式和协作模式。

  过去,代码规范停留在Markdown文档中,靠人来记忆和执行。现在,规范可以被转化为AI可理解的形式,嵌入开发流程。过去,隐性知识随着老员工离职而流失。现在,AI可以持续总结每个功能模块,使整个项目逐渐形成可理解的知识体系。

  “要想真正放飞效率,必须先打好基础。”褚秋实总结,“在开发过程中,不仅要完成业务功能,还要为代码库留下知识和规范。”

  淘宝闪购高级技术专家邓立山则看到了更远的未来:“从自动化角度来看,AI Coding未来会朝着更高的自动化程度发展。类似OpenClaw的系统,不再局限于单个应用或IDE插件,而是在更高层级协调多个系统。”

  他描绘了这样一个场景:AI接收到需求后,直接将任务拆分给各个微服务,每个微服务自动完成本模块的分析、设计和编码,再结合反思机制循环生成、检查和修复代码,接着自动完成集成测试并在发现问题时继续修复。

  “整个研发流程将会变得更加自动化和智能化。”

  结语

  回到那个18岁创业者的故事。他的16个AI员工每月“工资”400美元,在他睡觉时依然工作,已经帮他吸引了450多个用户,甚至带来了付费订单。

  但这个故事的另一面是:有人因为AI误操作删光了数据,有人因为配置不当把控制台暴露在公网,有人在为AI生成的屎山代码焦头烂额。

  OpenClaw的走红,不只是技术演进的自然结果,更是一个信号:Agent能力已经到达某个临界点,开始从实验室走向真实场景。但技术越强大,驾驭它所需的能力门槛就越高。

  正如姜天意所说:“团队决策者需要具备判断能力,能够根据应用规模、复杂度和风险来确定AI生成代码的边界,以及如何验证生成结果。否则可能出现这样的问题:过去是人类开发者制造屎山代码,现在则变成AI批量制造屎山代码。”

  Agent狂飙的时代已经到来。但决定它能跑多远的,或许不是技术本身,而是我们能否为它装上可靠的刹车。

0
相关文章