新闻动态
你的位置:开云官网切尔西赞助商(2025已更新(最新/官方/入口) > 新闻动态 >
记者 钱玉娟 2月14日,大模子云做事商硅基流动(SilliconFlow)晓示联接北京昇腾东谈主工智能计较中心,全面支捏基于昇腾算力的DeepSeek系列模子的独到化集群部署。
此前,硅基流动大模子云做事平台SiliconCloud首发上线了基于昇腾算力的满血版DeepSeek R1/V3模子,当先走通了在国产芯片部署DeepSeek模子的旅途。
时辰倒回至春节假期的2月1日,华为云晓示联接硅基流动推出基于昇腾云做事的DeepSeek R1/V3推理做事。彼时,华为云、硅基流动的官方公众号相隔一分钟官宣,标题均越过“首发”二字,内文用“连日攻坚”空洞了团队的勤劳。
首发
硅基流动创举东谈主袁进辉曾总结,硅基流动的时代中枢是提供一个推理引擎,主要向企业提供高性能LLM推理和磨练措置决策,匡助企业高效地部署AI哄骗。DeepSeek V3是震悚各人科技圈的开源、推理大模子,硅基流动与之适配提供做事尤其对口。
张开剩余85%在DeepSeek V3大模子发布前,DeepSeek创举东谈主梁文锋就曾问袁进辉,硅基流动要不要部署?彼时,梁文锋以致给出了建议:最少20台H800(英伟达GPU芯片),80台最佳,10台也不错,即是有点慢。
袁进辉算了一笔账:一个月80台做事器的净糜掷就得五六百万,“还不一定能用满,风险太大了”。他莫得下注。
看到DeepSeek创造一个又一个遗迹,袁进辉躁急且苦于莫得充沛的算力资源,直到一位共事突发奇想,“国产卡多,用国产卡吧”。
硅基流动向华为云主动提议了配合想法。
华为选拔自研的达芬奇架构,开发了昇腾910和昇腾310两款AI处理器芯片,而华为云又上线了昇腾AI云做事,于今约一年半时辰,面向企业提供一键接入得回AI算力的做事。
华为昇腾AI云做事有一个“百模千态”专区,其中除了华为自家的盘古大模子外,还能适配业界主流的上百个开源大模子,从而支捏企业和开发者更快速地创建我方的大模子哄骗。
开源的DeepSeek何其火爆,接入想法让硅基流动和华为云一拍即合。华为云认真调配算力资源,硅基流动认真让模子在GPU上不错入手并具备问答能力,同期确保模子入手知道、不亏本精度,且入手速率尽可能快。
2025年春节,硅基流动团队和华为云各业务团队险些无休,DeepSeek团队也在全程提供了许多告诫。
2月1日凌晨1点多,距离官宣基于华为昇腾的DeepSeek R1/V3推理做事上线还有10个多小时,硅基流动的一位高管发了一条一又友圈:平台接入了DeepSeek系列模子,且API做事价钱与DeepSeek官网同价。
2月1日今日,“硅基流动”的微信指数从昔时的险些为0环比飙升了8831.35%。其时,硅基流动是DeepSeek官方除外,第一个提供基于国产芯片的671B满血模子MaaS云做事的平台。
趁着热度,硅基流动也发布了一波招聘策动,其中洞开的视觉生成推理引擎工程师、异构硬件适配工程师、托付研发工程师等全职岗亭有15个,还有与生成式AI关连的算法、平台前端、平台后端等宗旨的实习工程师职位8个。
API做事竞争暗涌
“要斟酌并发,以及后续并发是否有法规。”一位与华为云配合接入DeepSeek-R1的AI哄骗厂商认真东谈主称,这是通盘要接入的平台企业随机哄骗居品齐会斟酌的事情,背后的穷困主要由华为云方面在措置。
布局DeepSeek API做事,不仅仅腾讯、阿里、百度等巨头争抢的交易,不少模子革命企业也参与其中。
提供模子云做事的供应商虽多,但上述硅基流动高管看到,依然有模子测试关连东谈主士给用户提供了一些判断的依据,比如供应商提供的是否为原版的671B参数范畴?供应商提供做事的高下文窗口(谈话模子在进行展望或生成文本时,所斟酌的前一个词元即Token或文本片断的大小范围)大小是否为平时的64K+?终末还有AI支持编程苦求的通过情况,供应商对AI模子时代的哄骗是否受TPM(开导管束,一般在10W台以上)的法规。
陈天楚在浙江大学ARClab认真大模子关连磋商,他看到,接入DeepSeek的各个云厂商,面向的客户、官宣的老本限度和订价策动有永别。举例,有的厂商提供满血版,有的则是量化压缩版,还有提供蒸馏后的小模子。
陈天楚觉得,除了提供范例化的模子API做事外,云厂商间的较量主要积聚在能否提供个性化做事。像硅基流动就在上线671B的DeepSeek V3/R1旗舰模子后,又上线了6款DeepSeek R1蒸馏版模子,其中的8B、7B、1.5B模子免费,企业或个东谈主用户、开发者使用模子或基于模子开发AI哄骗时,能班师调用硅基流动的SiliconCloud平台上的API,浅易易用。
摈弃2月13日,有来自模子测试东谈主士的收尾反馈,在提供DeepSeek API做事的主流供应商中,和华为云深度配合的硅基流动,其AI做事反应的推理、生成以及平均速率,不仅优于承载压力过大的DeepSeek官方,更与腾讯云、阿里云等厂商拉开了距离。
“+DeepSeek”后果待定
收成于春节假期的突击作战,年后上班第一天(2月5日),华为推出了基于原生鸿蒙操作系统的小艺助手App,既接入了DeepSeek模子推理能力,还在“智能体”选项中上架了DeepSeek-R1的Beta版。
短短5天后,华为智妙手机纯血鸿蒙版小艺App的DeepSeek-R1智能体升级为郑再版,新增“联网搜索”功能,学问库变得更丰富,时效性也更强。
2月13日,记者在广州一家华为手机线下销售门店体验。通盘更新为纯血鸿蒙系统的手机上,小艺从昔时在系统内可被叫醒的贤慧语音助手做事,变成一个寥落的哄骗居品。进入小艺App,便不错与“她”问答对话,也能在第三方智能体中班师点击DeepSeek-R1,进入深度念念考对话,不必下载第三方App。
华为领有自研的盘古AI大模子,小艺即是通过盘古大模子磨练出来的。纯血鸿蒙中的小艺,在成为一个寥落哄骗后,其使用界面中有越过DeepSeek的方面。
记者看到,门店销售东谈主员手中的参考辛苦上,除了有“何如说”“何如作念”来体验小艺,还有盘古大模子永别庸碌数据模子的一些对比,会强调盘古大模子领有扎根华文的罕见上风。对DeepSeek,材料并未说起。
上述AI哄骗厂商认真东谈主在袭取经济不雅察网记者采访时,给出了居品接入DeepSeek模子能力后重要计划的变化。
“大模子幻觉变少,任务见效能变高。”该认真东谈主浮现,其团队在用DeepSeek的模子履行某项任务时,失败率基本为0。接入这一明星大模子后,模子幻觉有所减少,但他指出,大模子幻觉手脚共性问题,仍有待措置。
其实,该认真东谈主地点的AI企业也有大齐参加革命自研的通用大模子以及针对行业哄骗的专属大模子。他告诉记者,现在业内集体涌向DeepSeek,广宽作念法并非是用DeepSeek系列模子与自己现存模子和会,而是用DeepSeek的模子来开拓新的哄骗场景。
这位认真东谈主与陈天楚有共鸣,DeepSeek是推理模子,实效性并非其的上风,但却不错通过模子云做事商等AI基础要领赋能。
一位平台高管跟许多主流大模子厂磋商论过智能体在各个硬件终局上买通的问题,在她看来,这亦然DeepSeek畴昔时代落地以及现时业内“+DeepSeek”风潮后的发展宗旨,“每个硬件齐可能成为智能体的进口,通过履行东谈主类的任务来磨练专属个东谈主的智能体”。
为什么是硅基流动
硅基流动创举东谈主袁进辉是又名联贯创业者,他在2017年诞生的一流科技(OneFlow),在国内2023年涌起AI大模子风潮后,估值一度超数亿好意思元。
同庚,好意思团联接创举东谈主王慧文创业了大模子公司光年除外,他提议通过并购OneFlow的花样,邀请袁进辉加入光年除外成为联接创举东谈主。光年除外后被好意思团收购,袁进辉在2023年8月晓示追溯到AI基础要领界限陆续创业,创立了硅基流动。
硅基即芯片,而流动有软件之意,这一称呼也与袁进辉此前创立的一流科技酿成呼应,让芯片的算力在软件基础上跑起来。
加快AGI普惠东谈主类,是硅基流动官方公众号上的简介,袁进辉不啻一次在公开神志默示,其宗旨是为宏大的开发者提供基于AI模子进行哄骗革命的重要“铲子”,让路发者兑现Token目田。
硅基流动昨年年中推出SiliconCloud后,不仅日均调用量超千亿Token,针对多个主流模子的做事还提议了耐久免费。
“面向C端用户的大模子App,以后完满面免费了。”袁进辉2月14日默示,国内模子厂商很难对C端用户收取订阅费,多是厂商我方职守算力老本。
在袁进辉看来,模子厂商唯有得回用户后才有宗旨去变现。
数据炫夸,DeepSeek的哄骗探询使用量正呈现指数级高涨开yun体育网,成为现在最快冲破3000万日活跃用户量的哄骗智力。
发布于:北京市下一篇:没有了

