• 首页
  • 迪士尼彩乐园登陆网址
  • 迪士尼彩乐园微信群
  • 迪士尼彩乐园登陆网址

    迪士尼彩乐园贴吧 大众华东谈主决战AI之巅!马斯克Grok 3险胜DeepSeek,豪恣启动钞能力,压力给到OpenAI

    发布日期:2024-12-10 23:15    点击次数:186

    智东西2月18日报谈,刚刚,基于20万块的GPU集群锻真金不怕火,马斯克口中地球上最智慧的AI Grok-3终于亮相!

    这次直播伊隆·马斯克(Elon Musk)主要厚爱听,两位华东谈主研究员坐在C位撑场,辨认是曾接事于的研发小组N2Formal的吴宇怀(Yuhuai “Tony” Wu),以及多伦多大学狡计机科学助理锤真金不怕火Jimmy Ba,他是“深度学习三巨头之一”、图灵奖得主辛顿的学生,曾在Meta担任研究员。

    ▲Jimmy Ba(左二)、吴宇怀(左三)、伊隆·马斯克(最右)

    这次,xAI发布了Grok-3、Grok-3 mini,两个推理模子Grok-3 Reasoning和Grok-3 mini Reasoning,首个AI智能体DeepSearch。Grok-3在基准测试中打败了Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet、GPT-4o。酬酢平台X的Premium Plus订阅用户在Grok的诈欺法度和网页端不错体验推理、编程,以及DeepSearch的搜索能力。

    此外,xAI还开启了单独的会员订阅谋划SuperGrok,SuperGrok的价钱为每月30好意思元(折合约218东谈主民币)或每年300好意思元(折合约2184东谈主民币),可解锁特殊的推理、DeepSearch查询,以及无尽的图像生成服从。

    OpenAI蚁合首创东谈主、前特斯拉AI总监、闻明狡计机科学家李飞飞的爱徒安德烈·卡帕西(Andrej Karpathy)在推特发文评价Grok-3:“Grok-3+Thinking嗅觉与OpenAI最雄伟的模子o1-pro(每月200 好意思元)绝顶,略好于DeepSeek-R1和Gemini 2.0 Flash Thinking。”

    ▲AI大神卡帕西评价Grok-3的部分截图(图源:X,经谷歌翻译为汉文)

    万众期待的语音功能这次并未展示,马斯克败露,最快一周后Grok将得回“语音形式”。几周后,xAI将在企业API中提供Grok-3模子与DeepSearch功能。几个月后,xAI将开源Grok-2。

    直播临了放出了Grok用马斯克声息对话的彩蛋~

    //oss.zhidx.com/uploads/2025/02/67b423ef8997c_67b423ef847f1_67b423ef847b6_705_1739858846.mp4

    一、Grok-3现场念念考卡壳,水平与本科毕业生绝顶,2年内要上火箭

    现场演示要领中,Grok被考验了两个任务,一是现场遐想了一条往复地球与火星间的合理旅途,并用动画呈现,二是遐想一款近似俄罗斯方块的消消乐游戏。在演示中Grok“念念考卡壳”,因为骄傲“Thinking Hard”后很长一段时辰莫得反应,恭候几秒后演示东谈主员关闭了页面开启下一话题。

    之后演示东谈主员又回到念念考页面,分析了Grok的生成欺压。

    率先是其现场遐想的一条往复地球与火星间的合理旅途。教导词是“制作从地球降落在火星,然后不才一个放射窗口复返地球的放射动画三维图表并生成代码”。不外,测试东谈主员在Grok-3 mini经管问题的进程中打断了它,并切换到了能力更雄伟的满血版Grok-3。

    114秒后,Grok-3经管了这一问题,具有航空航天教授的马斯克现场评价谈,Grok给出的经管决策基本正确,他还煞有介事声称,2年内Grok将会接入SpaceX的火箭。在场的职工立地簸弄,说马斯克“预言什么皆是两年内”。

    在遐想一款近似俄罗斯方块的消消乐游戏时,Grok生成的代码在复制后即可运行。其教导词是“制作一个同一了俄罗斯方块和坚持的游戏,代码可能很长,将其输出为一个文献,让它变得相等棒”。临了游戏的运行机制比拟合理。马斯克同期告示,xAI将成立一个游戏责任室,使用AI进行游戏的设备责任。

    Agent能力现在仍是是各家大模子企业皆在押注的标的,xAI也不例外。他们给模子配备了更多的器具,本次Grok-3仍是具有Deep Search功能,xAI称其为低级Agent能力。

    演示中,测试东谈主员开启DeepSearch功能,让Grok-3斟酌SpaceX下一次火箭放射的时辰。回答问题时,Grok-3既会给出念念维链实质的转头,也会将完好意思念念维链提供给用户。它的搜索范围十分过去,从X平台上的实质到百科网站,再到好意思国政府的磋商文献。

    进行DeepSearch时,Grok-3还会充分沟通用户问题背后的意图、需乞降缱绻,也会对信息开始进行交叉磨真金不怕火,从而给出更为准确的回答。

    仍是有抢先体验的用户在X发布了100%由Grok-3生成的游戏,用户只需要告诉它我想要什么,并将代码放在正确的位置,就不错得到一个完好意思的游戏。

    //oss.zhidx.com/uploads/2025/02/67b42a4a9f56c_67b42a4a99504_67b42a4a994db_esvEg1EEGJbc-zUH.mp4

    关于Switch 2的发布时间,有业内人士分析称,迪士尼彩乐园尽管任天堂官方设定的发布截止日期为2025年3月31日,但鉴于近期频繁的设计泄露以及当前Switch销量的下滑,任天堂可能会提前发布以避免市场风险。市场研究机构DFC Intelligence则预测,Switch 2在2025年的销量将达到1500万至1700万台,到2028年累计销量有望突破8000万台。

    在里面,研究东谈主员发现Grok仍是不错经管很多复杂的工程问题,爽快多数时辰,水平大要绝顶于别称本科毕业生。而17个月前,Grok还很难经管高中数常识题。

    二、20万块GPU力大砖飞,性能打败o3-mini high、DeepSeek-R1

    直播演示中提到,Grok-3所波及的锻真金不怕火量是Grok 2的10倍,这皆建立在xAI孟菲斯的AI超等狡计机集群之上。该集群建造的第一阶段,xAI在122天内建成了领有10万块NVIDIA H100 GPU的超等狡计集群,第二阶段拓展到20万块GPU集群仅用了92天。

    基准测试欺压骄傲,Grok-3在评估模子在数常识题样本上性能的AIME和使用博士水平的物理、生物学和化常识题测试模子GPQA、LCB Oct-Feb中打败Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet、GPT-4o。

    Grok-3的早期版块在Chatbot Arena中得回1400分,名轮番一。Chatbot Arena是一项众包测试,让不同的AI模子互相竞争,并让用户对他们可爱的回答进行投票。Grok-3亦然有史以来第一个打破1400分的模子。

    xAI发布的推理模子早期版块Grok-3 Reasoning Beta,在最新的数学基准测试AIME 2025中达到93分,在GPQA上达到85分,这杰出了o3-mini的最好版块o3-mini high以及DeepSeek-R1。

    此外,用户还不错灵通“Big Brain”形式让Grok进行特殊、更仔细的推理。xAI将该形式形色为最符合数学、科学和代码磋商问题的功能。马斯克还提到,他们掩蔽了一些推理进程,以正式蒸馏。

    关于开源,几个月后xAI将开源Grok-2。马斯克说:“咱们的步伐是当下一个版块扫数发布时,将开源Grok的上一个版块,也等于当Grok-3熟识褂讪时,咱们将开源Grok-2。”

    xAI合计预锻真金不怕火模子远远不够,委果的AI需要具备反念念、第一性旨趣磨真金不怕火等能力。他们通过强化学习让Grok-3学会了上述能力,结束了锻真金不怕火和推理时的两种Scaling Law。

    Grok团队成员还败露,Grok-3的语音交互功能是通过原生语音交互模子结束的,模子将简略径直瓦解用户语音,然青年景对应的语音复兴,是一个端到端的进程,无需语音转翰墨、翰墨转语音行为中间要领。

    马斯克称,异日他们将会进一步加大数据中心的成立力度,xAI的下一个狡计集群会成为寰球上最雄伟的集群,能耗达到1.2GW,绝顶于数十万户家庭1年的用电量。

    三、基于合成数据锻真金不怕火,谋划筹集约100亿好意思元资金

    值得一提的是,这次直播马斯克又缓不救急,推迟18分钟运转,但临了X上xAI官方账号中的直播不雅看东谈主数仍是杰出286万东谈主次。刚下直播马斯克就马不休蹄转发、点赞科技播客顶流Lex Fridman、AI大神卡帕西等对Grok-3的感触。

    在Grok-3发布之前,马斯克就按耐不住在X上让Grok-3秀本事。

    他让Grok仿照电影《指环王》中“适度之诗”作念了工程师版诗歌:“以lor’s ring诗句的格调先容适度的发源,指派工程师进行高档大模子搜索、代理、挂牵、幽默的责任,使其接近原作”。

    Grok生成的诗歌临了还有对私着名词的谛视,与原著如何对应等。

    法新社此前报谈,Grok-3是在合成数据上继承锻真金不怕火的,况兼能通过查验数据来响应它所犯的特地以达到逻辑一致性。

    融资方面,上周,据媒体征引音尘东谈主士报谈,xAI还正在筹商潜在投资者,谋划筹集约100亿好意思元资金,此轮融资可能使该公司估值达到约750亿好意思元。昨年12月,xAI告示完成C轮融资,筹集了60亿好意思元。xAI总融资额仍是达到120亿好意思元(约合东谈主民币876亿元)。

    结语:马斯克赓续押注大算力AI

    本次发布的Grok 3不管是在锻真金不怕火集群范畴、用电量上皆是首屈一指的,这也在一定进程上飘浮为了Grok 3在多个基准测试上的SOTA弘扬。凭证马斯克在采访中的言论,异日xAI可能还会赓续押注大算力AI这条发展旅途。

    不外,也有国外网友蛮横的评价谈,自DeepSeek-R1之后,咱们只应试虑后果更高的高出,而不单是那些范畴更大、且比竞争敌手耗能更多的高出。