人工智能 频道

怎么看报告指出的生成式AI存在95%的失败率?

麻省理工学院《2025年商业人工智能现状》报告引发热议,其原因不难理解。报告开篇便以醒目标题指出:尽管企业已投入逾300亿美元用于生成式人工智能,但95%的试点项目仍未能投入实际生产。

阻碍企业发展的并非技术本身或相关法规,而是工具的使用方式。多数系统无法融入实际工作流程:它们缺乏记忆能力,无法适应变化,使用后也鲜有改进。结果就是大量试点项目在实验室中前景光明,实践中却一塌糊涂。报告指出,这正是多数部署无法突破测试阶段的根本原因。

尽管部分批评者认为该报告存在过度炒作或方法论缺陷,但就连他们也不得不承认,报告精准捕捉了众多企业团队的隐忧——真正的回报尚未显现,至少未达预期。

麻省理工学院《2025年商业人工智能现状》( MIT’s State of AI in Business 2025)报告团队将此现象称为“生成式AI鸿沟”:约5%的试点项目能转化为数百万美元收益,而其余95%的项目则停滞不前,永远困在测试阶段。

这种鸿沟耐人寻味,其成因并非取决于模型优劣、芯片速度或规避监管。麻省理工学院研究人员指出,关键在于工具的应用方式:成功案例往往构建或采购了能无缝融入实际工作流程并随时间优化的系统;而失败案例则试图将通用AI硬塞进笨拙流程,妄图借此实现转型。

应用规模的差异更凸显了这种鸿沟。ChatGPT、Copilot等通用工具已无处不在——超过80%的企业至少进行过试用,近40%表示已以某种形式部署。但这些工具真正提升的只是个人效率,并未改变企业的损益状况。

麻省理工学院的研究发现,企业级工具的困境更为严峻。约60%的企业考察过定制平台或供应商系统,但仅20%进入试点阶段。多数失败源于工作流过于脆弱、工具缺乏学习能力,且无法适应实际工作场景。

麻省理工学院的解释引发了一个问题:问题出在工具本身,还是企业使用方式?报告坚称关键在于适配性而非技术本身,但随即又指出工具缺乏学习和适应能力。这种矛盾始终未被彻底解决,也正是部分批评者认为该研究夸大其词的原因之一。

麻省理工学院通过四种模式来阐释这种分歧。第一种是有限颠覆。在研究的九个行业中,仅科技与媒体两大领域显现实质变革迹象,其余行业仍停留在试点阶段,鲜有新商业模式或客户行为转变的实证。第二种是企业悖论。大型企业虽启动最多试点项目,却最迟缓于规模化部署——中型企业通常90天即可完成从测试到推广的周期,而大型企业往往耗时近九个月。

第三种模式是投资偏向。麻省理工学院指出,约70%的预算流向销售与营销领域,因其成效更易衡量,尽管后台自动化领域往往能实现更高回报——该领域可削减外包与代理成本。第四种模式是实施优势。外部合作项目部署成功率达67%,而内部自主开发项目仅为33%。麻省理工学院据此论证:决定成败的关键在于方法论而非资源规模。

该报告遭批评之处在于其核心数据的呈现方式。报告虽提及“95%企业AI项目失败”的结论,却未详细说明计算方法及数据来源。如此大胆的论断缺乏透明度,难免引发质疑。

成功与失败的界定标准同样引发争议。即使试点项目在实施过程中创造了部分效益,只要未能带来持续利润增长,仍被视为失败。这种框架可能使微薄回报显得毫无进展。

鉴于该项目与开发新型人工智能代理协议的商业机构存在关联,其中立性也遭到质疑。报告建议直接指向这一倾向:成功企业应选择采购而非自主研发,将人工智能工具赋予业务团队而非集中实验室,并选用能融入日常工作流程且持续优化的系统。

据报告称,下一阶段将聚焦于Agentic AI,相关工具将具备跨供应商的学习、记忆与协同能力。作者描述了一个正在形成的智能体网络,其中这些系统以静态试点项目无法企及的方式处理真实业务流程。他们认为,这种智能体网络最终有望实现大多数早期通用人工智能部署难以企及的规模与一致性。

0
相关文章