迪士尼彩乐园3官网 硅基流动让DeepSeek模子在国产芯片上跑起来

经济不雅察网 记者 钱玉娟 2月14日,大模子云工作商硅基流动(SilliconFlow)布告协调北京昇腾东谈主工智能狡计中心,全面支握基于昇腾算力的DeepSeek系列模子的独到化集群部署。
此前,硅基流动大模子云工作平台SiliconCloud首发上线了基于昇腾算力的满血版DeepSeek R1/V3模子,最初走通了在国产芯片部署DeepSeek模子的旅途。
时刻倒回至春节假期的2月1日,云布告协调硅基流动推出基于昇腾云工作的DeepSeek R1/V3推理工作。彼时,华为云、硅基流动的官方公众号相隔一分钟官宣,标题均凸起“首发”二字,内文用“连日攻坚”笼统了团队的死力。
首发
硅基流动首创东谈主袁进辉曾总结,硅基流动的本事中枢是提供一个推理引擎,主要向企业提供高性能LLM推理和历练责罚有假想,匡助企业高效地部署AI哄骗。DeepSeek V3是畏俱人人科技圈的开源、推理大模子,硅基流动与之适配提供工作尤其对口。
在DeepSeek V3大模子发布前,DeepSeek首创东谈主梁文锋就曾问袁进辉,硅基流动要不要部署?彼时,梁文锋致使给出了建议:最少20台H800(GPU芯片),80台最佳,10台也不错,便是有点慢。
袁进辉算了一笔账:一个月80台工作器的净花费就得五六百万,“还不一定能用满,风险太大了”。他莫得下注。
看到DeepSeek创造一个又一个古迹,袁进辉惊恐且苦于莫得充沛的算力资源,直到一位共事突发奇想,“国产卡多,用国产卡吧”。
硅基流动向华为云主动残暴了配合想法。
华为接受自研的达芬奇架构,开发了昇腾910和昇腾310两款AI处理器芯片,而华为云又上线了昇腾AI云工作,于今约一年半时刻,面向企业提供一键接入获得AI算力的工作。
华为昇腾AI云工作有一个“百模千态”专区,其中除了华为自家的盘古大模子外,还能适配业界主流的上百个开源大模子,从而搭救企业和开发者更快速地创建我方的大模子哄骗。
开源的DeepSeek何其火爆,接入想法让硅基流动和华为云一拍即合。华为云谨慎调配算力资源,硅基流动谨慎让模子在GPU上不错运转并具备问答材干,同期确保模子运转郑重、不耗损精度,且运转速率尽可能快。
2025年春节,硅基流动团队和华为云各业务团队险些无休,DeepSeek团队也在全程提供了好多教诲。
2月1日凌晨1点多,距离官宣基于华为昇腾的DeepSeek R1/V3推理工作上线还有10个多小时,硅基流动的一位高管发了一条一又友圈:平台接入了DeepSeek系列模子,且API工作价钱与DeepSeek官网同价。
2月1日今日,“硅基流动”的微信指数从昔时的险些为0环比飙升了8831.35%。那时,硅基流动是DeepSeek官方以外,第一个提供基于国产芯片的671B满血模子MaaS云工作的平台。
趁着热度,硅基流动也发布了一波招聘策划,其中敞开的视觉生成推理引擎工程师、异构硬件适配工程师、委用研发工程师等全职岗亭有15个,还有与生成式AI关系的算法、平台前端、平台后端等概念的实习工程师职位8个。
API工作竞争暗涌
“要探究并发,以及后续并发是否有规矩。”一位与华为云配合接入DeepSeek-R1的AI哄骗厂商谨慎东谈主称,这是所有要接入的平台企业梗概哄骗家具皆会探究的事情,背后的费当事人要由华为云方面在责罚。
布局DeepSeek API工作,不仅仅腾讯、阿里、百度等巨头争抢的贸易,不少模子立异企业也参与其中。
提供模子云工作的供应商虽多,但上述硅基流动高管看到,也曾有模子测试关系东谈主士给用户提供了一些判断的依据,比如供应商提供的是否为原版的671B参数范围?供应商提供工作的高下文窗口(言语模子在进行展望或生成文本时,所探究的前一个词元即Token或文本片断的大小范围)大小是否为频频的64K+?临了还有AI补助编程肯求的通过情况,供应商对AI模子本事的哄骗是否受TPM(开垦不断,一般在10W台以上)的规矩。
陈天楚在浙江大学ARClab谨慎大模子关系研究,他看到,接入DeepSeek的各个云厂商,面向的客户、官宣的本钱适度和订价策划有别离。举例,有的厂商提供满血版,有的则是量化压缩版,还有提供蒸馏后的小模子。
陈天楚合计,除了提供尺度化的模子API工作外,云厂商间的较量主要聚拢在能否提供个性化工作。像硅基流动就在上线671B的DeepSeek V3/R1旗舰模子后,又上线了6款DeepSeek R1蒸馏版模子,其中的8B、7B、1.5B模子免费,企业或个东谈主用户、开发者使用模子或基于模子开发AI哄骗时,能平直调用硅基流动的SiliconCloud平台上的API,绵薄易用。
截止2月13日,有来自模子测试东谈主士的结尾反馈,在提供DeepSeek API工作的主流供应商中,和华为云深度配合的硅基流动,迪士尼彩乐园Ⅱ邀请码其AI工作反应的推理、生成以及平均速率,不仅优于承载压力过大的DeepSeek官方,更与腾讯云、阿里云等厂商拉开了距离。
“+DeepSeek”成果待定
圣诞节当天早上,曼城众星和家人一起度过,然后他们前往俱乐部训练基地准备傍晚的训练。
成绩于春节假期的突击作战,年后上班第一天(2月5日),华为推出了基于原生鸿蒙操作系统的小艺助手App,既接入了DeepSeek模子推理材干,还在“智能体”选项中上架了DeepSeek-R1的Beta版。
短短5天后,华为智高手机纯血鸿蒙版小艺App的DeepSeek-R1智能体升级为郑再版,新增“联网搜索”功能,学问库变得更丰富,时效性也更强。
2月13日,记者在广州一家华为手机线下销售门店体验。所有更新为纯血鸿蒙系统的手机上,小艺从昔时在系统内可被叫醒的贤慧语音助手工作,变成一个寂寥的哄骗家具。进入小艺App,便不错与“她”问答对话,也能在第三方智能体中平直点击DeepSeek-R1,进入深度念念考对话,无谓下载第三方App。
华为领有自研的盘古AI大模子,小艺便是通过盘古大模子历练出来的。纯血鸿蒙中的小艺,在成为一个寂寥哄骗后,其使用界面中有凸起DeepSeek的方面。
记者看到,门店销售东谈主员手中的参考贵府上,除了有“何如说”“何如作念”来体验小艺,还有盘古大模子别离庸俗数据模子的一些对比,会强调盘古大模子领有扎根华文的很是上风。对DeepSeek,材料并未说起。
上述AI哄骗厂商谨慎东谈主在接受经济不雅察网记者采访时,给出了家具接入DeepSeek模子材干后关节假想的变化。
“大模子幻觉变少,任务见效力变高。”该谨慎东谈主表示,其团队在用DeepSeek的模子本质某项任务时,失败率基本为0。接入这一明星大模子后,模子幻觉有所减少,但他指出,大模子幻觉手脚共性问题,仍有待责罚。
其实,该谨慎东谈主地点的AI企业也有多半参加立异自研的通用大模子以及针对行业哄骗的专属大模子。他告诉记者,现在业内集体涌向DeepSeek,浩瀚作念法并非是用DeepSeek系列模子与本身现存模子会通,而是用DeepSeek的模子来开拓新的哄骗场景。
这位谨慎东谈主与陈天楚有共鸣,DeepSeek是推理模子,实效性并非其的上风,但却不错通过模子云工作商等AI基础法子赋能。
一位平台高管跟好多主流大模子厂盘问论过智能体在各个硬件结尾上买通的问题,在她看来,这亦然DeepSeek畴昔本事落地以及刻下业内“+DeepSeek”风潮后的发展概念,“每个硬件皆可能成为智能体的进口,通过本质东谈主类的任务来历练专属个东谈主的智能体”。
为什么是硅基流动
硅基流动首创东谈主袁进辉是别称邻接创业者,他在2017年开垦的一流科技(OneFlow),在国内2023年涌起AI大模子风潮后,估值一度超数亿好意思元。
同庚,好意思团协调首创东谈主王慧文创业了大模子公司光年以外,他残暴通过并购OneFlow的神气,邀请袁进辉加入光年以外成为协调首创东谈主。光年以外后被好意思团收购,袁进辉在2023年8月布告挂牵到AI基础法子规模连接创业,创立了硅基流动。
硅基即芯片,而流动有软件之意,这一称呼也与袁进辉此前创立的一流科技造成呼应,让芯片的算力在软件基础上跑起来。
加快AGI普惠东谈主类,是硅基流动官方公众号上的简介,袁进辉不啻一次在公开时局示意,其概念是为远大的开发者提供基于AI模子进行哄骗立异的关节“铲子”,让路发者竣事Token目田。
硅基流动旧年年中推出SiliconCloud后,不仅日均调用量超千亿Token,针对多个主流模子的工作还残暴了长期免费。
“面向C端用户的大模子App,以后皆全面免费了。”袁进辉2月14日示意,国内模子厂商很难对C端用户收取订阅费,多是厂商我方职守算力本钱。
在袁进辉看来,模子厂商只好获得用户后才有办法去变现。
数据骄气,DeepSeek的哄骗看望使用量正呈现指数级飞腾,成为现在最快冲破3000万日活跃用户量的哄骗门径。

钱玉娟经济不雅察报记者
TMT新闻部记者恒久矜恤并报谈TMT规模的首要事件,时刻保握新闻敏锐,发现前沿趋势。擅长企业方法、东谈主物专访及行业深度报谈。伏击新闻陈迹可酌量[email protected]微信号:EstherQ138279