人工智能 频道

MongoDB瞄准AI检索难题

  通过整合长期记忆、嵌入和重排序,该公司旨在提升对代理输出的信任。

  尽管具备强大的技术能力,大型语言模型(LLM)仍然存在记忆问题。它们可能无法跨对话保留上下文,也并不总是包含允许其访问相关数据的框架,最终导致结果不可靠且不一致。

  NoSQL数据库先驱MongoDB正在解决这一问题,发布了新的持久记忆、检索、嵌入和重排序功能,所有这些都集成在一个平台中。该公司还推出了新的安全连接、开源插件和其他框架集成,以支持代理式AI工作负载。

  支持代理记忆

  MongoDB AI现场首席技术官Pete Johnson在新闻发布会上表示:“释放代理的力量需要记忆。就像人类的记忆一样,良好的代理记忆能够组织知识。它帮助代理根据上下文检索正确的知识,学会做出更明智的决策,并随着时间推移采取优化后的行动。”

  为了推进自动检索和持久代理记忆,该公司正在MongoDB向量搜索中添加自动Voyage AI嵌入。该功能现已在公开预览中可用。

  碎片化的AI堆栈带来了另一个挑战。当开发者与碎片化问题搏斗时,他们常常被迫承担MongoDB CPO Ben Cefalo所说的“同步税”。为了使数据对代理可搜索,开发人员必须将向量搜索、操作数据存储、嵌入模型和缓存拼接在一起,然后花时间构建复杂的数据管道,以保证各系统之间的数据同步。

  但Cefalo声称,通过将Voyage AI原生集成到Atlas中,MongoDB将一个“多周的工程项目变成了两分钟的配置”。开发人员可以更快、更轻松地交付可靠、值得信赖的代理,并且“无需所有复杂的数据管道”。

  与此相呼应,该公司宣布了LangGraph.js长期记忆存储的正式可用性。Cefalo指出,JavaScript和TypeScript用户构成了全球最大的开发者社区,但该公司现有的Python集成此前将这些群体限制在短期、单线程的内容处理上。

  现在,他们可以使用MongoDB为代理提供持久的长期记忆,以便在“他们已经信任的数据管道上”于对话中保留偏好和交互历史记录。Cefalo解释说,这凸显了MongoDB长期以来的“无处不在”战略。

  引入嵌入与重排序

  Johnson指出,代理必须能够根据上下文检索信息,并从中学习和优化检索过程,同时尽可能减少LLM令牌的使用,因为如果没有一致、高精度的检索,用户就会失去信任。

  他说,大多数用户错误地将这种缺乏信任归咎于LLM,“本能地升级到最新、最广泛、最昂贵的模型。”然而,归根结底这是一个检索问题:模型只能根据提供的信息采取行动;如果数据不准确、过时或缺乏上下文,输出最终会出错,导致潜在的“灾难性”业务后果。

  Johnson说:“这正是我们从客户那里听到的感受:他们对AI代理感到兴奋,但如果结果不一致、不相关或完全错误,他们会担心将这些代理放到客户面前。”

  解决方案是提前为LLM提供所需的正确信息——这正是嵌入和重排序模型的用途。MongoDB一直在将这些技术集成到其Voyage 4系列模型中,基于该公司于2025年2月收购Voyage AI的基础。

  正如Johnson所解释的,嵌入模型将PDF、图像、视频和音频等非结构化信息转换为向量,这些向量捕获并映射数据含义,同时对相关数据进行分组。“这就是你获得语义搜索——而非精确关键词搜索——的方式。”

  重排序模型则更进一步。在嵌入模型检索结果之后,重排序器将其与用户的查询进行比较,从而提供更相关、有根据的响应。Johnson解释说:“把嵌入模型想象成一个宽大的网,重排序器从中挑选出最好的鱼。”

  他说,嵌入和重排序功能都原生集成到MongoDB中,因此企业客户不必在不同供应商之间切换,最终避免“将堆栈整合成一个会造成运维头痛的东西”。

  Johnson还强调了这样一个事实:技术领导者现在对其数据平台做出的决定,要么会加速他们的AI开发,要么会推迟数月甚至数年。他说:“这不是未来的问题,而是今天的问题,因为开发的成功取决于他们正在使用的数据平台。”

  数据库增强与新集成

  除了提供新的记忆功能外,MongoDB还在加强其数据基础。Cefalo解释说,其数据库的最新版本MongoDB 8.3现已普遍可用,代表了其核心产品的“深度架构强化”,以更低的成本支持更快的AI工作负载。

  查询表达式(检索和组织数据的指令)原生集成到MongoDB中,因此开发人员不必依赖外部工具箱;转换逻辑保留在数据库内。Cefalo说:“这就是数据工程师的SQL式数据转换。”

  此外,MongoDB还宣布了Atlas与Feast的集成。Feast是广泛采用的开源特征存储,在训练和推理期间为AI和LLM应用程序提供结构化数据。Cefalo说,这意味着机器学习(ML)团队可以操作,而不必玩“数据库音乐椅的高风险游戏”——后者需要他们将数据从主要训练数据库转移到一个单独的实时推理系统。

  他说:“这种数据库蔓延不仅造成了运营开销,还带来了数据漂移:即模型在一个版本的现实上训练,却对另一个版本做出预测。”这可能既复杂又昂贵,也是扩展AI的障碍。

  最后,为了支持安全性和合规性,MongoDB正在通过AWS PrivateLink向MongoDB Atlas提供跨区域连接。该连接支持AWS服务、虚拟私有云(VPC)和本地网络之间的连接,而不会将流量暴露在公共互联网上。Cefalo解释说,这一集成现已普遍可用,提供了一个“单一的、可审计的模型”,能够简化合规性,并为跨多个地区运营的组织保持强大的安全态势。

0
相关文章