人工智能 频道

微软准备向OpenAI追投100亿美元

  据报道,在OpenAI的最新大型语言模型ChatGPT取得突破性成功后,微软正计划向该公司追投100亿美元。

  11月30日,OpenAI发布了一款研究工具ChatGPT,凭借其对问题做出令人信服的文本响应的神奇能力,ChatGPT在互联网上掀起了一场风暴。大型语言模型是基于一个早期(而且规模更大)的大型语言模型(LLM)GPT-3.5,现已正式走红,并在互联网上非正式地成为“下一个大事件”。

  人们将ChatGPT的推出与互联网历史上的其他开创性事件进行了比较,如2007年iPhone的首次亮相和1994年第一个商业Web浏览器。“一切都变了,”一些人宣称。学生将不再写学期论文,程序员不再需要写代码,律师也不再需要写简报,即使是勤奋的记者(叹气!)也可能很快失业,这一切都要归功于ChatGPT以最准确的方式将文本串在一起的能力(尽管有15%到21%的“幻觉率”)。

  LLM的铁是热的,多家公司正寻求通过砸下一些现金来拥有OpenAI的一部分。据《华尔街日报》上周的一篇报道,由萨姆·奥特曼(Sam Altman)领导的这家旧金山初创公司允许员工以290亿美元的估值出售股票。根据Semafor本周的一篇报道,微软似乎是最大的赢家之一。

  Semafor详细介绍了微软100亿美元投资的特殊条款:

  Semafor的Liz Hoffman和Reed Albergotti写道:“微软的注入将是一项复杂交易的一部分,在收回投资之前,该公司将获得OpenAI 75%的利润。”。“达到这一门槛后,它将恢复到反映OpenAI所有权的结构,微软持有49%的股份,其他投资者持有49%,OpenAI的非盈利母公司持有2%。”

  微软已经独家提供在其Azure云数据中心培训OpenAI模型的服务。训练LLM是一项不小的成就。GPT-3于2020年春季首次亮相,它使用了一个具有1750亿参数的变压器模型。微软在2020年5月的一篇博文中描述了其培训投资:

  “为OpenAI开发的超级计算机是一个单一系统,拥有超过28.5万个CPU核、10000个GPU和每台GPU服务器每秒400千兆比特的网络连接。与世界500强超级计算机上的其他计算机相比,它排名前五。”

  训练这么大的模特很昂贵。据一些人估计,训练一个具有1750亿参数的模型需要一个多月的时间,计算成本超过500万美元,而最初开发模型可能需要10倍的时间。

  随着LLM的每一代,结果的质量都会提高,但数据、能源和资金的投入却呈指数级增长。GPT-4可能会在2023年以100万亿个参数首次亮相,它可能需要数据、能源和美元再增加一个数量级。

  风险很高,这就是为什么微软和其他公司愿意向OpenAI投入这么多资金的原因。LLM是否会定义未来十年的消费科技领域尚未确定,但许多富有和有影响力的人显然认为他们有机会这样做。

  据报道,微软计划将OpenAI的技术融入到各种产品中,包括其必应搜索引擎,该搜索引擎落后于谷歌同名搜索引擎。它甚至计划将各种GPT功能(如问答和文本生成)引入其Office套件。据《信息报》报道,OpenAI模型的一个版本已经在Word中使用。

  OpenAI和微软之间的所有人工智能活动都让谷歌处于守势。据报道,这家山景科技巨头的首席执行官桑达尔·皮查伊(Sundhar Pichai)宣布,引入LLM的必应(Bing)搜索引擎有可能切入其利润丰厚的搜索业务。谷歌的研究人员开发了OpenAI使用的许多核心底层技术,据报道,该公司正在加快计划,在其搜索引擎中使用其最大、最好的LLM,即LaMDA。据报道,对道德和潜力的担忧——而不是一名谷歌员工在2022年声称的LaMDA是否具有感知能力——是阻碍谷歌推出更具侵略性的LLM的原因。

  

0
相关文章