人工智能 频道

踏上构建人工智能知识图的征途怎么做?

      尽管检索增量生成在应对简单查询时颇为有效,但处理高级推理问题则需跨越文档界限,深挖信息间的内在联系。这,便需要一张知识图来助力。

  那么,如何从非结构化数据(诸如文本、图像等多媒体内容)启程,踏上构建知识图的征途呢?网络搜索引擎的演进为我们提供了宝贵的启示,它展示了如何从纷繁复杂的非结构化资源中萃取知识,并随时间的推移,将这些知识精炼成结构化、相互交织的图表。正如本文即将阐述的,这一过程正是我们从检索增量生成(RAG)系统迈向GraphRAG、Knowledge-GraphRAG等更高级方法的坚实基石。

  从孤立的节点到知识图和知识图

  像AltaVista这样的早期搜索引擎依赖于简单的关键字匹配,将网页视为孤立的实体。然而,网页是通过超链接相互连接的。谷歌通过认识到万维网不仅仅是独立页面的集合,而是一个庞大的相互关联的知识网络——我们称之为知识图,改变了搜索。

从ALTAVISTA到谷歌,从字符串到事物

  虽然这种方法显著增强了搜索能力,但很快很明显,为了支持推理等更高级的功能,需要一个更强大的解决方案:一个结构化的、机器可读的框架。这种视角的转变最终导致谷歌在2012年引入了知识图,该图被“事物不是字符串”这一短语所概括,旨在连接实体,而不仅仅是文字。

  知识图与知识图:GOK是一个更广泛、更具概念性的想法,专注于相互关联的信息,不一定具有高度结构化。KG是指一个正式的、结构化的、机器可读的实体和关系网络,专为高级推理和人工智能任务而设计。


  知识图(GoK)是一个更广泛、更具概念性的想法,专注于相互关联的信息,不一定是高度结构化,而知识图(KG)是指一个正式的、结构化的、机器可读的实体和关系网络,专为高级推理和人工智能任务而设计。

  网络的发明者Tim Berners-Lee早就预见到了这种结构化方式来组织信息的必要性,在他的《编织网络》一书中创造了“语义网络”一词。虽然这种语义网络的愿景需要时间才能实现,但谷歌的知识图使其变得实用,为复杂的人工智能系统的发展奠定了基础,该系统可以对这些知识网络进行推理。同样,像亚马逊这样的公司创建了一个产品图表,开源社区致力于维基数据等倡议,该倡议将维基百科组织成一个庞大的公共知识图表。

  从知识图到问题解答

  知识图的创建改变了信息的检索、组织和连接方式,从简单的关键字匹配转变为复杂的实体识别。但这种进步并没有止步于改善网络搜索。它成为解决人工智能中更复杂问题的基石,特别是在问答(QA)系统领域。

  QA系统是生成人工智能领域中最强大的应用程序之一,需要从结构化和非结构化数据中提取精确信息的能力。随着问题的复杂性增加,对更结构化、相互关联的知识的需求也在增加——就像知识图的开发解决了对更深入、更符合上下文的网络搜索的需求一样。

  有三种常见的问题类型,每种问题对结构化数据有不同的复杂性和要求:

  单点访问问题:简单的基于事实的查询,可以通过检索单个文本片段来回答。

  多点访问问题:需要多个文本片段的问题,必须一起检索和呈现,以获得全面的答案。

  高级推理问题:更复杂的查询需要整合多个信息,通常需要超出标准语言模型能力的符号推理。

  虽然前两种问题类型通常可以使用知识图来回答,但第三类问题(高级推理问题)需要更结构化的方法——真正的知识图。


  从RAG到GraphRAG:通过GoK回答问题

  在生成型人工智能时代,检索增量生成生成已成为先进的回答问题方法。与早期基于关键字的搜索引擎一样,RAG将文档视为独立的实体,对每个文档段进行单独索引。因此,虽然RAG对更简单的查询有效,但该方法并没有利用文档中存在的信息之间的更深层次的联系。


  为了解决这一限制,微软在2024年初引入了GraphRAG的概念。GraphRAG将信息组织成知识图,使其能够利用信息之间的关系,就像谷歌如何通过将页面视为互连网络的一部分来彻底改变网络搜索。大型语言模型(LLM)在这个过程中发挥着至关重要的作用。当呈现一组文档时,LLM会以三胞胎的形式生成实体和关系。虽然这些三胞胎可能包含噪音或冗余,但它们为有效组织信息提供了一种强大的方法。

  通过将文本段落视为图中的节点,GraphRAG可实现图操作,如社区检测、模式提取和图遍历。这些操作允许合成多个信息,然后可以输入到RAG模型中,为多点问题生成更丰富、更准确的答案。

  简而言之,GraphRAG通过将零碎的文本连接到图形状结构来帮助构建知识图,为LLM提供更相关、互连的输入,以提高问题回答性能。


  在GRAPHRAG管道中,文档通过实体和它们之间的关系链接在一起(知识图),然后是社区检测,这导致了每个社区的文件摘要。

  从GraphRAG到Knowledge-GraphRAG:回答KG的问题

  虽然GraphRAG依靠LLM的推理能力在知识图中连接基于文本的数据,但第三类问题——那些需要深度推理的问题——需要的不仅仅是GoK。他们需要一个完全结构化的知识图,其中事实、实体和关系被组织成一个正式的本体。知识图不仅存储事实信息,还捕捉了对高级推理至关重要的复杂关系和规则。

  在这些场景中,LLM仍然很重要,但它们的作用从生成或合成内容转变为查询结构化KG。LLM从知识图中检索实体和关系,并根据其中的结构化知识制定查询。然后,一个专门的知识图引擎执行查询,返回一个精确和合乎逻辑的答案。

  这个过程在我们最近的出版物《QirK:通过知识图的中间表示回答问题》中进行了详细说明,该出版物概述了将LLM功能与知识图的逻辑能力相结合以回答复杂查询的框架。该框架支持在流行的维基数据知识图之上回答问题。可以回答的示例问题是“说出一部由昆汀·塔伦蒂诺或马丁·斯科塞斯执导的由罗伯特·德尼罗担任演员的电影”、“哪部电影导演与演员结婚?”和“列出罗伯特·德尼罗和阿尔·帕西诺都出演的电影”。


  通往高级人工智能推理的道路

  生成式人工智能正为我们重塑知识组织与检索方式带来前所未有的机遇。从非结构化数据(如文本、图像等)迈向完全结构化的知识图(蕴含丰富的事实、逻辑约束及递归规则)的征程,既复杂又充满挑战,但其潜在回报却极为丰厚。在此过程中,知识图作为中间步骤,为推进问答等人工智能应用提供了切实可行的解决方案,即便我们仍在不懈追求构建更全面知识图的宏伟目标。

尽管打造高质量知识图的道路可能漫长且艰难,但GraphRAG等工具的出现,无疑标志着这一征途中的重要里程碑。它们有效弥合了非结构化文本与结构化知识之间的鸿沟,为人工智能系统更准确地应对日益复杂的问题奠定了坚实基础,使先进、推理驱动的问答系统愿景逐步成为现实。

作者:RelationalAI的Research-ML副总裁Nikolaos Vasiloglou对此深有体会,他拥有超过20年在各行业实施高价值机器学习与人工智能解决方案的丰富经验。


0
相关文章