迪士尼彩乐园招商 20万块英伟达芯片练出Grok 3:测试得分均高于竞争敌手,运算智商是上代10倍

发布日期:2025-01-21 23:14    点击次数:152

预热许久的“地表最贤慧AI”Grok 3肃穆亮相。

2月18日,首创东谈主埃隆·马斯克旗下xAI推出最新大模子Grok 3,并在直播中进行了现场演示。马斯克称,止境鼎沸大概推出 Grok3,它的智商将在短时辰内比Grok2巨大了十倍。“xAI和Grok的想法是结伙天地的骨子。”

功能完满的Grok 3将在一周后肃穆上线,不外用户依旧需要“钞智商”才调体验到最新版块的Grok。

直播先容,Grok 3测试版现已面向马斯克旗下X平台的X Premium订阅用户洞开,“咱们今天将推出Grok3,最初从X上的Premium Plus订阅者运行,他们将是第一批得回访访权限的东谈主。请确保更新您的X应用阵势以探索通盘高等功能,因为咱们刚刚发布了更新。淌若您有兴味尽早使用Grok 3,请注册Premium Plus。”

xAI还针对Grok 3建造了新的订阅功能。“此外,咱们还将为想要得回起首进功能和尽早使用新功能的诚实粉丝推出一项名为Super Grok的单独订阅。这项做事适用于Grok应用阵势和新网站grok.com。”据报谈,

马斯克暗意,展望一周之后Grok 3的通盘功能将肃穆上线。他说,“淌若你想要一个更完善的版块,可能值得恭候一周,但每天齐会有所改换。咱们还在建造语音交互功能,以便你不错领有对话体验。我今天早些时刻试过了,遵守很好,尽管它仍然需要一些完善。咱们的指标是让你不错像和东谈主交谈相通和它交谈。我以为这将是Grok3最好的体验之一,但这应该还要一周傍边的时辰。”

马斯克说,谋划在每次发布新版块时,对上一版块进行开源,也即是说,几个月后Grok 2行将开源。

xAI工程师先容,诚然Grok起步较晚,但在MMLU(大规模多任务话语结伙基准测试)得分上以超快地速率追上了ChatGPT,Grok 3和轻量化的Grok 3 mini在多方面性能上齐朝上或比好意思Gemini、DeepSeek和GPT-4o等敌手。

据先容,Grok 3在数学推理、科学逻辑推理和代码写稿等名堂的Benchmark测试(基准测试)中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 Pro更优的遵守。Grok 3分辨得分为52、75和57。Grok 3 mini分辨得分为40、65和41。这两个模子的得分齐高于Gemini、DeepSeek、Claude和GPT。

工程师说,“简略五天前,AIME2025竞赛戒指了,高中生们在一个特定的基准上竞争。然后咱们让两个模子在合并场教会中在合并基准上竞争。真谛的是,更大的Grok3推理模子在这场教会中确认更好。这标明,迪士尼彩乐园与较小的模子比较,较大的模子具有更强的泛化智商。然则,在客岁的教会中,较小的模子确认更好,因为它更有用地学习了往常的教会。”

在加州大学伯克利分校推出的Chatbot Arena (LMSYS)盲测中,早期版块的Grok 3假名“巧克力”打榜,一举夺魁并成为独逐一个得分超1400的模子,其在代码、提示反应等各个方面排行均为第一。

据马斯克此前先容,Grok 3是在无数的合成数据上教会的。它会反复查验数据,试图达到逻辑一致性。淌若有作假的数据,它会反念念并删除作假数据。

值得一提的是,有工程师还流露了xAI旗下超算中默算力一经翻倍,英伟达GPU数目已达到20万块。

据先容,客岁4月,马斯克以为xAI若想收效打造出最好AI,独一路线是自建数据中心。由于想尽快推出Grok 3,时辰厚爱,于是决定在四个月内建成数据中心。最终,团队耗时122天让第一批10万个GPU启动并运行。

不外要构建梦想中的AI需将集群规模翻倍。发布会上流露,这亦然团队初次公开驳斥此事,团队仅用92天就一经竣事了超算集群的算力翻倍,也即是GPU数目已达20万块。如今,xAI正愚弄这些巨大的策划智商抓续改换居品。

团队还流露,xAI一经运行商议下一个集群,为了大概带动更为巨大的AI,其功率将晋升约五倍,达到简略1.2千兆瓦。

现场,马斯克和工程师们演示了Grok 3的多种智商。在演示中,Grok 3为天际辐射生成动画3D,以及建造了一款将俄罗斯方块和坚持迷阵连合的游戏。

Grok 3为天际辐射生成动画3D

马刺输球后15胜15负,排名从西部第九掉到了第11。

Grok 3建造的游戏

此外,xAI的游戏责任室也肃穆得到官宣。马斯克暗意,“咱们将在xAI推出一个东谈主工智能游戏责任室。淌若你有兴味加入咱们并建造东谈主工智能驱动的游戏,请加入咱们。”