迪士尼彩乐园

热点资讯

迪士尼彩乐园登陆网址

迪士尼彩乐园贴吧大众华东谈主决战AI之巅！马斯克Grok 3险胜DeepSeek，豪恣启动钞能力，压力给到OpenAI

发布日期：2024-12-10 23:15 点击次数：188

智东西2月18日报谈，刚刚，基于20万块的GPU集群锻真金不怕火，马斯克口中地球上最智慧的AI Grok-3终于亮相！

这次直播伊隆·马斯克（Elon Musk）主要厚爱听，两位华东谈主研究员坐在C位撑场，辨认是曾接事于的研发小组N2Formal的吴宇怀（Yuhuai “Tony” Wu），以及多伦多大学狡计机科学助理锤真金不怕火Jimmy Ba，他是“深度学习三巨头之一”、图灵奖得主辛顿的学生，曾在Meta担任研究员。

▲Jimmy Ba（左二）、吴宇怀（左三）、伊隆·马斯克（最右）

这次，xAI发布了Grok-3、Grok-3 mini，两个推理模子Grok-3 Reasoning和Grok-3 mini Reasoning，首个AI智能体DeepSearch。Grok-3在基准测试中打败了Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet、GPT-4o。酬酢平台X的Premium Plus订阅用户在Grok的诈欺法度和网页端不错体验推理、编程，以及DeepSearch的搜索能力。

此外，xAI还开启了单独的会员订阅谋划SuperGrok，SuperGrok的价钱为每月30好意思元（折合约218东谈主民币）或每年300好意思元（折合约2184东谈主民币），可解锁特殊的推理、DeepSearch查询，以及无尽的图像生成服从。

OpenAI蚁合首创东谈主、前特斯拉AI总监、闻明狡计机科学家李飞飞的爱徒安德烈·卡帕西（Andrej Karpathy）在推特发文评价Grok-3：“Grok-3+Thinking嗅觉与OpenAI最雄伟的模子o1-pro（每月200 好意思元）绝顶，略好于DeepSeek-R1和Gemini 2.0 Flash Thinking。”

▲AI大神卡帕西评价Grok-3的部分截图（图源：X，经谷歌翻译为汉文）

万众期待的语音功能这次并未展示，马斯克败露，最快一周后Grok将得回“语音形式”。几周后，xAI将在企业API中提供Grok-3模子与DeepSearch功能。几个月后，xAI将开源Grok-2。

直播临了放出了Grok用马斯克声息对话的彩蛋～

//oss.zhidx.com/uploads/2025/02/67b423ef8997c_67b423ef847f1_67b423ef847b6_705_1739858846.mp4

一、Grok-3现场念念考卡壳，水平与本科毕业生绝顶，2年内要上火箭

现场演示要领中，Grok被考验了两个任务，一是现场遐想了一条往复地球与火星间的合理旅途，并用动画呈现，二是遐想一款近似俄罗斯方块的消消乐游戏。在演示中Grok“念念考卡壳”，因为骄傲“Thinking Hard”后很长一段时辰莫得反应，恭候几秒后演示东谈主员关闭了页面开启下一话题。

之后演示东谈主员又回到念念考页面，分析了Grok的生成欺压。

率先是其现场遐想的一条往复地球与火星间的合理旅途。教导词是“制作从地球降落在火星，然后不才一个放射窗口复返地球的放射动画三维图表并生成代码”。不外，测试东谈主员在Grok-3 mini经管问题的进程中打断了它，并切换到了能力更雄伟的满血版Grok-3。

114秒后，Grok-3经管了这一问题，具有航空航天教授的马斯克现场评价谈，Grok给出的经管决策基本正确，他还煞有介事声称，2年内Grok将会接入SpaceX的火箭。在场的职工立地簸弄，说马斯克“预言什么皆是两年内”。

在遐想一款近似俄罗斯方块的消消乐游戏时，Grok生成的代码在复制后即可运行。其教导词是“制作一个同一了俄罗斯方块和坚持的游戏，代码可能很长，将其输出为一个文献，让它变得相等棒”。临了游戏的运行机制比拟合理。马斯克同期告示，xAI将成立一个游戏责任室，使用AI进行游戏的设备责任。

Agent能力现在仍是是各家大模子企业皆在押注的标的，xAI也不例外。他们给模子配备了更多的器具，本次Grok-3仍是具有Deep Search功能，xAI称其为低级Agent能力。

演示中，测试东谈主员开启DeepSearch功能，让Grok-3斟酌SpaceX下一次火箭放射的时辰。回答问题时，Grok-3既会给出念念维链实质的转头，也会将完好意思念念维链提供给用户。它的搜索范围十分过去，从X平台上的实质到百科网站，再到好意思国政府的磋商文献。

进行DeepSearch时，Grok-3还会充分沟通用户问题背后的意图、需乞降缱绻，也会对信息开始进行交叉磨真金不怕火，从而给出更为准确的回答。

仍是有抢先体验的用户在X发布了100%由Grok-3生成的游戏，用户只需要告诉它我想要什么，并将代码放在正确的位置，就不错得到一个完好意思的游戏。

//oss.zhidx.com/uploads/2025/02/67b42a4a9f56c_67b42a4a99504_67b42a4a994db_esvEg1EEGJbc-zUH.mp4

关于Switch 2的发布时间，有业内人士分析称，迪士尼彩乐园尽管任天堂官方设定的发布截止日期为2025年3月31日，但鉴于近期频繁的设计泄露以及当前Switch销量的下滑，任天堂可能会提前发布以避免市场风险。市场研究机构DFC Intelligence则预测，Switch 2在2025年的销量将达到1500万至1700万台，到2028年累计销量有望突破8000万台。

在里面，研究东谈主员发现Grok仍是不错经管很多复杂的工程问题，爽快多数时辰，水平大要绝顶于别称本科毕业生。而17个月前，Grok还很难经管高中数常识题。

二、20万块GPU力大砖飞，性能打败o3-mini high、DeepSeek-R1

直播演示中提到，Grok-3所波及的锻真金不怕火量是Grok 2的10倍，这皆建立在xAI孟菲斯的AI超等狡计机集群之上。该集群建造的第一阶段，xAI在122天内建成了领有10万块NVIDIA H100 GPU的超等狡计集群，第二阶段拓展到20万块GPU集群仅用了92天。

基准测试欺压骄傲，Grok-3在评估模子在数常识题样本上性能的AIME和使用博士水平的物理、生物学和化常识题测试模子GPQA、LCB Oct-Feb中打败Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet、GPT-4o。

Grok-3的早期版块在Chatbot Arena中得回1400分，名轮番一。Chatbot Arena是一项众包测试，让不同的AI模子互相竞争，并让用户对他们可爱的回答进行投票。Grok-3亦然有史以来第一个打破1400分的模子。

xAI发布的推理模子早期版块Grok-3 Reasoning Beta，在最新的数学基准测试AIME 2025中达到93分，在GPQA上达到85分，这杰出了o3-mini的最好版块o3-mini high以及DeepSeek-R1。

此外，用户还不错灵通“Big Brain”形式让Grok进行特殊、更仔细的推理。xAI将该形式形色为最符合数学、科学和代码磋商问题的功能。马斯克还提到，他们掩蔽了一些推理进程，以正式蒸馏。

关于开源，几个月后xAI将开源Grok-2。马斯克说：“咱们的步伐是当下一个版块扫数发布时，将开源Grok的上一个版块，也等于当Grok-3熟识褂讪时，咱们将开源Grok-2。”

xAI合计预锻真金不怕火模子远远不够，委果的AI需要具备反念念、第一性旨趣磨真金不怕火等能力。他们通过强化学习让Grok-3学会了上述能力，结束了锻真金不怕火和推理时的两种Scaling Law。

Grok团队成员还败露，Grok-3的语音交互功能是通过原生语音交互模子结束的，模子将简略径直瓦解用户语音，然青年景对应的语音复兴，是一个端到端的进程，无需语音转翰墨、翰墨转语音行为中间要领。

马斯克称，异日他们将会进一步加大数据中心的成立力度，xAI的下一个狡计集群会成为寰球上最雄伟的集群，能耗达到1.2GW，绝顶于数十万户家庭1年的用电量。

三、基于合成数据锻真金不怕火，谋划筹集约100亿好意思元资金

值得一提的是，这次直播马斯克又缓不救急，推迟18分钟运转，但临了X上xAI官方账号中的直播不雅看东谈主数仍是杰出286万东谈主次。刚下直播马斯克就马不休蹄转发、点赞科技播客顶流Lex Fridman、AI大神卡帕西等对Grok-3的感触。

在Grok-3发布之前，马斯克就按耐不住在X上让Grok-3秀本事。

他让Grok仿照电影《指环王》中“适度之诗”作念了工程师版诗歌：“以lor’s ring诗句的格调先容适度的发源，指派工程师进行高档大模子搜索、代理、挂牵、幽默的责任，使其接近原作”。

Grok生成的诗歌临了还有对私着名词的谛视，与原著如何对应等。

法新社此前报谈，Grok-3是在合成数据上继承锻真金不怕火的，况兼能通过查验数据来响应它所犯的特地以达到逻辑一致性。

融资方面，上周，据媒体征引音尘东谈主士报谈，xAI还正在筹商潜在投资者，谋划筹集约100亿好意思元资金，此轮融资可能使该公司估值达到约750亿好意思元。昨年12月，xAI告示完成C轮融资，筹集了60亿好意思元。xAI总融资额仍是达到120亿好意思元（约合东谈主民币876亿元）。

结语：马斯克赓续押注大算力AI

本次发布的Grok 3不管是在锻真金不怕火集群范畴、用电量上皆是首屈一指的，这也在一定进程上飘浮为了Grok 3在多个基准测试上的SOTA弘扬。凭证马斯克在采访中的言论，异日xAI可能还会赓续押注大算力AI这条发展旅途。

不外，也有国外网友蛮横的评价谈，自DeepSeek-R1之后，咱们只应试虑后果更高的高出，而不单是那些范畴更大、且比竞争敌手耗能更多的高出。

上一篇：迪士尼彩乐园代理不管关系多好，给你送这三种礼物便是瞧不起你，已经别干系了

下一篇：迪士尼彩乐园最高代理《掌心》坏老翁101来了，王志飞和黄海冰，谁的演技更胜一筹？

迪士尼彩乐园