OpenAI的先进模子遭逢瓶颈, 堆数据作念不可AGI

发布日期：2024-12-03 10:57 点击次数：98

外界对于东说念主工智能领先的“期待感”正在消退，这无疑是当下所有这个词AI行业最大的痛点，因此继续撑抓本钱阛阓信心的似乎只剩下了AGI（通用东说念主工智能）。而AGI将在改日5年内罢了，这亦然OpenAI CEO阿特尔曼、特斯拉独创东说念主马斯克、英伟达独创东说念主黄仁勋等一众科技界大咖的展望。

从ChatGPT到GPT-4到o1，从LLama 1.0到3.0、Claude1到Claude3，如同打怪升级一般徐徐罢了AGI，这是以OpenAI为代表的AI厂商试图形容的改日图景。只是近日有音信涌现，OpenAI下一代旗舰模子“猎户座”（Orion）的跳动速率大幅放缓，合成数据越训越像旧模子、编码性能致使还在败落。

其实不单是是OpenAI，谷歌的Gemini 2.0、Anthropic的Claude 3.5 Opus等先进AI模子也被传出遇到了瓶颈，以至于业界开动规划如今被奉为尺度Scaling law行将失效。事实上，对于Scaling law的论争亦然近期X平台的热门，从OpenAI的拓荒者到NYU、OSU等著名大学的熟习皆参与其中。

所谓Scaling law，其实是OpenAI在2020年提议的一个对于基于transformer讲话模子的法规，指的是大模子的最终性能主要与推测量、模子参数目和查考数据量三者的界限大小关连，与模子的具体结构基本无关。OpenAI在发现了这个法规后，就搭建了领有200亿参数的GPT-3.5-Turbo，而ChatGPT恰是在后者的基础上出身。

要知说念在曩昔荒谬长的一段时分里，机器学习规划领域并莫得把数据量行为主要规划对象，因为数据一般被以为是被迫变量，巨额的规划是集会在若何灵验缩短查考舛误和罢了模子复杂度上。客不雅来说，Scaling law亦然曩昔两年AI大模子赛说念风起潮涌的基础，因为它讲解了通过预查考使用更多的数据和算力，省略让AI模子的性能暴涨。

Scaling law在AI领域的意旨就如同摩尔定律之于半导体行业，用李开复博士在知乎上的恢复就不错解释这条法规的进犯性，“Scaling Law的抓续影响下，岂论是硅谷照旧国内，大模子赛说念正在掀翻一场AI Infra的‘武备竞赛’”。

曩昔两年，OpenAI、微软、谷歌、Meta、Anthropic等AI赛说念的头部厂商其实皆在作念合并件事，即以多数推测资源为赌注，来赌Scaling Law的收益递减改日省略得到料理。在这一趋势下，海量资金被用于购买算力芯片、筹建数据中心，以及购买数据。

而Scaling Law的存在也让所有这个词业界弥散着一股乐不雅情愫，仿佛购买更多的英伟达芯片、拿下更多的数据、获取更多的水电资源，AGI似乎便是水到渠成的事情。对于OpenAI等大厂来说，罢了Scaling Law需要的硬件资源和工程践诺亦然远胜于时刻和想想的护城河。

那么为什么会出现OpenAI Orion越查考越像旧模子呢？因为“新的、未拓荒的高质地东说念主类生成查考数据”正在成为稀缺资源。在曩昔几年里，大模子的迭代升级经过委果也曾把各式公开可用的数据集、网站、册本，以过火他开始的数据耗尽，而合成数据的普遍使用，则会导致新模子在查考中变得与旧模子更靠拢。

换而言之，要是料理了高质地查考数据的供给，业界就能继续在Scaling law这条说念路向前进。问题在于高质地查考数据的产出跟不上大模子的“破费”，而且跟着越来越多试验领有者意志到了数据的价值，使得其变得越来越贵。这就意味着数据匮乏的问题不仅在2024年变得严峻，在改日还将变得更难以料理。

Scaling Law的边缘效应愈发突显、AI大模子撞上“数据墙”，这对于所有这个词AI行业无疑是一个危急的信号。著名好意思国通晓科学家、AI泡沫论支抓者Gary Marcus就在酬酢平台上暗示，所有这个词AI行业关连公司的高估值是成立在模子才气贬抑增强，省略飞速达到AGI的预期之上。

是以一朝迭代速率放缓，行业就将进入价钱战，这就意味着AI行业在找到我方的“现款牛”、获取切实的事迹增长、回收基础阵势上的庞杂干与前，需要先进行罪过的破费战。这对于投资者而言无疑是一个好天轰隆，也很难不让他们梦意想当年的互联网泡沫。

要是不想重蹈二十年前互联网泡沫闹翻的覆辙，AI公司就必须找到Scaling Law以外的新说念路。当今，OpenAI给出的料理决策是切换赛说念，The Verge日前就发文称， OpenAI方面缠绵于2025年1月推出名为“Operator”的AI智能体，其才气访佛于Claude 3.5 Sonnet、主打能像东说念主类相通操作电脑。

对此OpenAI首席居品官凯文・韦尔指出，2025年可能是智能体进入主流阛阓的要道时分。其实智能体并不是什么新宗旨，早在一年前，比尔·盖茨就曾在博客著述中预言，AI智能体将会成为继Windows、iOS/Android之后的下一个平台。在此之前，OpenAI、Anthropic、谷歌、Meta等引流潮水的头部AI厂商之是以不作念智能体，只是因为追赶AGI彰着更有“钱景”。

如今在Scaling law失灵也曾近在刻下的情况下，头部AI厂商的AGI梦看来将会变得牛年马月。这时候从头捡起交易出息更好的智能体，就阐发OpenAI更求实了，毕竟想要罢了高大的期望先得活下来才行。