万众瞩目的GPT-4.5,似乎即将在本周震撼发布!这一消息在ChatGPT安卓版本(1.2025.056 测试版)上初露端倪,其中出现了“GPT-4.5研究预览(GPT-4.5 research preview)”的字样,并紧随一段注释:Pro订阅用户现在可以访问我们最新、最大的模型。这一发现瞬间在网络上引发了轩然大波,关于GPT-4.5的种种爆料也如雨后春笋般涌现。
早在两周前,OpenAI的领军人物奥特曼(此处为网友对OpenAI创始人或相关负责人的昵称)就在自己的推特上剧透,称“GPT-4.5将在未来几周内发布”。他同时证实,GPT-4.5就是此前多次被曝光的Orion(猎户座),这个从去年8月就浮出水面的新项目,被定位为OpenAI的新旗舰,即GPT-4的下一代。更令人瞩目的是,奥特曼明确表示,GPT-4.5将是OpenAI最后一个非推理模型。在GPT-4.5发布后,OpenAI计划将GPT系列和o系列模型合并为一个单一的AI,这一消息无疑为GPT-4.5的发布增添了更多的分量。
而就在“未来几周内”的预言即将成真的今天,推特上再次传来重磅消息。来自The information的Stephanie Palazzolo在推文中透露,OpenAI领导者已告知员工,GPT-4.5将于本周推出。这一消息如同一颗石子投入平静的湖面,瞬间激起了层层涟漪。
那么,这个即将空降的GPT-4.5究竟是何方神圣呢?根据网络上曝光的种种信息,我们可以一窥其真容。GPT-4.5是一个参数爆表的庞然大物,拥有1T激活参数的Transformer MoE模型,在120T tokens数据上进行了训练。要知道,GPT-4的总参数也不过1.8T,可见GPT-4.5的规模之庞大。此外,它的上下文窗口长度为256K,自带知识截至2024年6月,更是一个具有人类视觉水平的Agent。
尽管奥特曼已经明确表示GPT-4.5不是一个推理模型,但有人发现其输出过程却与众不同。GPT-4.5是边思考边吐结果的,而不是一次思考过后只吐一次结果。这种边思考边输出的方式,让人不禁对其“非推理模型”的定位产生了些许疑惑。不过,也有网友猜测,这可能与GPT-4.5已经对整个互联网进行了RAG(检索增强生成)处理有关。
除了这些基本资料外,GPT-4.5还新增了许多令人惊叹的能力。比如,它可以制作动画SVG文件,只需要简单的交流几轮,就能得到一个会翻白眼的蒙娜丽莎(当然,这是夸张的说法)。另外,GPT-4.5还可以零样本制作音乐,并且非常有原则地拒绝制作受版权保护的歌曲。这一功能让人不禁想起了OpenAI五年前发布的Jukebox音乐模型,如今GPT-4.5的多模态能力再次得到了提升。
然而,尽管GPT-4.5即将与大家见面,但测试过该模型的人士却透露,其在某些任务上的表现好坏参半。比如,Anthropic前天发布的混合推理模型Claude 3.7 Sonnet,就在某些基准测试中击败了GPT-4.5。这一消息无疑为GPT-4.5的发布蒙上了一层阴影。
此外,关于GPT-4.5的开放范围也引发了网友们的热议。根据现有信息,GPT-4.5首批似乎只针对Pro用户开放,即一个月200美元那档。这一决定让许多网友感到不满,毕竟OpenAI现在四面受敌,至少也应该让Plus用户也抢先体验上吧?不过,也有网友猜测,这可能是奥特曼的营销策略,先放出风声说首批只有Pro用户能体验,然后再告诉大家Plus用户也能体验,从而提升大家的好感度。
总的来说,GPT-4.5的即将发布无疑是一个令人振奋的消息。其庞大的参数、强大的能力以及新增的多模态功能都让人对其充满了期待。然而,其在某些任务上的表现以及开放范围的问题也让人对其产生了一些疑虑。不过,无论如何,我们都将拭目以待,期待这个庞然大物能够给我们带来更多的惊喜和突破。毕竟,在AI技术日新月异的今天,每一个新的进步都可能引领我们走向一个更加美好的未来。