人工智能 频道

企业级AI为何屡屡受挫?问题并不出在模型上

企业领导者已投入两年时间和数千亿美元用于AI。但成效却参差不齐。根据麦肯锡2024年全球调查显示,不到三分之一的企业表示其AI投资产生了有意义且持久的商业价值。演示环节往往令人印象深刻,但实际应用却令人失望。

最常见的归因是模型不够好、数据基础设施不够成熟,或者员工未经培训,这种归因诊断在很大程度上是错误的,或者至少是不完整的。

真正的问题在于上下文,具体来说,是缺乏一个位于AI与数据之间、持久且动态的企业上下文层,除非企业理解这一点并据此构建系统,否则单纯模型升级和基础设施投资都无法弥合这一差距。

语境缺口

无论是对话分析工具、财务规划代理还是供应链优化器,所有企业级AI系统都通过将人类提出的问题转化为机器可执行的任务来运作。为了准确完成这种转化,系统必须理解业务本质、数据的含义、指标的定义、适用的业务规则,以及这些规则随时间推移的演变过程。

这种理解正是我们所说的“上下文”。在大多数企业部署中,这种理解要么缺失,要么不完整,要么正以无人能 及的速度逐渐消亡。

试想一家全球2000强制造商部署了用于财务分析的AI系统,该系统可以访问数据仓库并运行查询。但当规则涉及公司间转移、区域成本分摊以及最近两次收购中设定的例外情况时,它能否准确计算各业务单元的毛利率?这些规则存在于少数资深财务分析师的脑海中,它们散见于电子表格、三年前的Slack对话记录,以及未被记录的机构记忆中。当这些分析师调岗或退休时,相关知识便随之消失,而缺乏这种背景信息的AI系统,开始生成虽然精确但错误的答案。

这并非数据质量问题,而是背景信息问题,且这种现象在各行各业普遍存在。

领导者常犯的四大误区

一个有效的语境层需要满足四个结构性要求,而大多数组织在这方面都未能达标。

1. 语境必须具备自学习能力

最常见的错误是将语境视为一次性实施。组织在初始语境捕获阶段投入大量资源,标记元数据、记录业务定义、归档已批准的查询,随后便将其视为完成,但语境建设永远不会真正结束。

上下文会持续变化且往往在无形中逐渐失效。随着工程团队不断演进数据模型,数据结构也会随之改变。当上游数据源发生无人正式公告的变动时,数据也会产生漂移。业务指标会被重新定义,在收购或定价模式变更后,“ARR”的含义也会发生变化。业务流程会进行重组,驱动上季度仪表盘的逻辑会悄然失效。等到错误浮出水面时,上下文往往已经过时数月之久。

如果上下文层依赖人工维护,人类就会成为瓶颈,且永远难以跟上变化。一个有效的上下文引擎需要从使用模式、经过验证的答案以及人工更正中持续学习,随着时间的推移不断改进,而非逐渐退化。

2. 上下文是多维的,无法被集中捕获

企业知识并不存在于单一系统中,它同时存在于数据模型中、存在于经多年验证的分析师查询所编码的逻辑中、存在于正式与非正式的文档中、存在于语义层与元数据层中,更存在于仅存于人们脑海中的隐性知识中。

大多数企业犯下的错误是追求单一的上下文来源,无论是元数据目录、语义层还是数据字典,并期望它能承担全部重任。但是没有任何单一层级能够做到这一点,资深分析师历经五年打磨的经验之谈,其中蕴含的业务逻辑是任何文档化工作都无法完全捕捉的。元数据层记录了结构,却无法传达意义;语义层记录了定义,却无法体现这些定义在实际应用中蕴含的判断依据。

一个有效的语境层必须同时覆盖所有这些维度,并在各维度独立演进的过程中保持整体的一致性。

3. 上下文层在架构上必须独立于底层数据平台

这是影响最为深远的架构决策,但大多数组织并未给予足够重视。

当上下文构建在特定平台内部时,无论是云数据仓库、湖仓架构,还是供应商专有的语义层,它都会与该平台的专有结构和API产生纠缠。上下文层是数据组织所创造的最有价值的知识资产,它承载着多年的业务逻辑、经过验证的查询以及机构知识。一旦该资产依赖于特定平台,组织便丧失了架构灵活性与谈判筹码。

这一问题因大多数企业已面临的现实而加剧:数据极少集中于单一位置。典型的全球2000强企业运营于异构环境中:Snowflake用于企业级数据仓库,Databricks用于数据科学工作负载,Salesforce用于客户关系管理(CRM),SAP用于企业资源规划(ERP),此外还有大量短期内难以整合的遗留系统和部门级系统。在任何单一平台内部构建的上下文层,只能捕获该平台所见的内容,而无法涵盖更多。那些至关重要的业务问题,将营收表现与运营数据及客户行为相联系,需要跨越所有这些系统的上下文。

因此,抽象化不仅是对未来平台变更的一种对冲,更是唯一能够适应当今企业数据实际存在状况的架构。数据架构不断演进,系统迁移时有发生,今日最优的平台三年后可能不再适用。已将上下文层进行抽象化的企业,既能全面覆盖当前的数据环境,又可在平台迁移时无需从头开始;而未进行抽象化的企业则在两个维度上都受到限制,往往直到迁移已经启动时才意识到其代价。

4. 每个AI代理都继承了上下文问题,并使其恶化

随着企业从辅助工具和聊天机器人转向自主代理,第四维度的问题才变得迫在眉睫。

使用辅助工具时,人类始终处于决策回路中,分析师会阅读答案、运用判断力、发现错误。这种反馈循环具有容错性。而代理式AI的核心特征在于,它在运行过程中没有这种持续的人工检查点,AI代理能够自主、大规模、持续地执行查询、整合数据、生成报告并触发下游工作流。

这种自主性正是其核心价值所在,也正是为何底层上下文层的质量变得不可妥协。

配置不当的仪表盘可能在某次会议中向某人提供错误数据。但若代理基于过时或不完整的上下文运行,在任何人察觉异常之前,该错误便会蔓延至数十个下游系统和决策中。使代理具有价值的自主性,恰恰也是让不良上下文变得极其危险的特性。组织部署的每个智能代理,其可靠性完全取决于支撑它的上下文质量;若将自信却错误的答案以机器速度嵌入自动化工作流,无异于埋下治理失效的定时炸弹。

投资决策框架

对于评估AI投资的高层领导者而言,有四个问题值得直接提出。

  • 系统是具备自学习能力,还是需要人工维护?依赖人工维护的上下文层终将衰败,因此有必要向供应商具体询问:上下文如何随时间更新,以及维持其准确性需要多少人力投入。

  • 它能捕捉多少维度的上下文?那些仅孤立地处理单一层级(如元数据、语义定义或查询历史)的解决方案,值得持怀疑态度。更具说服力的系统会整合多维上下文,并在各维度演进过程中保持其一致性。

  • 上下文是否具备可移植性?如果组织两年后需要迁移数据平台,已构建的上下文将何去何从?答案将揭示架构中蕴含了多少战略锁定。

  • 代理的治理模型是什么?在部署自主代理之前,组织应能明确说明这些代理基于何种上下文、如何验证该上下文,以及存在哪些机制可在错误扩散前进行检测和纠正。

战略启示

成功的企业AI部署中呈现出的模式具有一致性。能够创造持久价值的组织,未必是拥有最大模型或最多数据的那些,而是那些投资于一个动态、多维、平台独立的上下文层,并将其视为战略资产而非实施细节的组织。

对于大规模运营的企业而言,构建和维护这一上下文层就是AI投资。现在就认识到这一点的企业将建立起复利效应般的优势,而那些继续将其视为次要事项的企业,则会陷入一个代价高昂且循环往复的困境:试点项目在演示时令人印象深刻,但在实际生产中却令人失望。

关于作者:Soham Mazumdar 是一位连续创业家和技术领袖,目前担任 WisdomAI 的联合创始人兼首席执行官。

0
相关文章