DeepSeek时刻:云巨头集中接入

2月2日—4日,腾讯云、百度智能云、阿里云先后接入DeepSeek相关大模型,而大厂在春节假期为深度求索公司加班,只是DeepSeek爆火的一个证据。英伟达市值蒸发创纪录、OpenAI上新o3-mini推理模型、DeepSeek卡顿、榜单第一……与深度求索直接间接相关的新闻,在春节期间不断刷新。

单论拥抱DeepSeek,海外同行的动作更快,微软、英伟达、亚马逊云科技等在1月底就已接入。据称DeepSeek以3%的成本超越了OpenAI,且开源,这意味着以低成本已可训练出足够好的AI模型。不管是为了客户的多样化需求,还是为了构建AI生态,云厂商快速接入最火的大模型,都是笔划算的买卖。

DeepSeek时刻:云巨头集中接入

七巨头集结

让更多开发者便捷调用DeepSeek,腾讯云再出一把力。2月4日,腾讯云又一次拉近与DeepSeek的距离,在腾讯云TI平台推出开发者大礼包:DeepSeek全系模型一键部署,部分模型限免体验。在此之前,腾讯云已在2月2日宣布将DeepSeek-R1大模型一键部署至腾讯云HAI上,开发者仅需3分钟就能接入调用,一改以往慢吞吞的风格。

更早打出低价牌的是百度智能云,2月3日,百度智能云千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低价格方案,用户还可享受限时免费服务。

记者了解到,目前腾讯云TI平台采用按量计费和包年包月计费模式,百度智能云千帆平台限时免费2周至2月18日24:00。

阿里云也在春节期间就开了工,大年初六,我们进入正题,阿里云以此开场,在2月3日宣布阿里云PAI ModelGallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。

对于费用,阿里云相关人士以全部部署好所需资源为例向记者介绍,部署DeepSeek-R1-Distill-Qwen-7B模型的价格约为11.1元/小时(以A10机型为例);部署DeepSeek-R1模型的价格约为316元/小时。模型部署成功后按实例运行时长计费,不满1小时按具体分钟数折算计费。目前阿里云百炼平台也已上线DeepSeek-R1和DeepSeek-V3模型API,且面向用户限时免费中。

华为云则在2月1日即宣布,硅基流动与华为云团队联合首发并上线基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。

这波比拼中,不在春节假期的海外公司占了先机。

1月31日,英伟达宣布,NVIDIA NIM(一种云原生微服务技术)已经可以使用DeepSeek-R1。微软同日称已将DeepSeek-R1正式纳入Azure AI Foundry,成为该企业级AI服务平台的一部分。

亚马逊云科技(AWS)也宣布:企业和开发者可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型,还可以使用AWS Trainium等以经济高效的方式部署DeepSeek-R1-Distill模型。

春节彩蛋

不是深度求索2025年1月20日发布的DeepSeek-R1,就是2024年12月26日上线的全新系列模型DeepSeek-V3,海内外大厂接入的,正是春节前就在各大主流媒体和社交网站刷屏的大模型黑马。

突然间,美国在人工智能领域相对于中国的领先地位,似乎比自ChatGPT走红以来的任何时候都要小。英国《经济学人》杂志评论,理由是一家中国公司(即深度求索)发布了最新的令人印象深刻的大语言模型。

从数据到体感,印象深刻的例子不难找。

七麦数据显示,1月27日至今,DeepSeek在中国内地免费苹果总榜、应用榜、效率榜均排在第一名,放大到全球榜单,截至记者发稿,DeepSeek在72个地区的免费苹果总榜、应用榜、效率榜位居榜首。

根据AI产品榜1月31日的数据,DeepSeek上线18天日活用户数1500万,ChatGPT达到同样的数据用了244天,增速是ChatGPT的13倍之多,DeepSeek被公认为是全球增速最快的AI应用。

除了大模型的真本事,春节或许也是DeepSeek加速扩散的原因之一。

2025年1月28日除夕夜,在互联网大厂工作的林悦(化名)把DeepSeek生成的拜年祝福分享在家族群。就这样,DeepSeek被分发到天南海北,那晚他给自己及亲戚好友生成了不低于10个新春祝福。第二天,林悦在西北四线城市生活的阿姨告诉他,自己在社交平台刷到了谈论DeepSeek的短视频。

再比如登上热搜第一的话题:DeepSeek回答如何过好这一生,它的回复是:没有完美的人生剧本,所有选择都有代价,关键是要有承担选择的勇气。记者也向DeepSeek提出了同样的问题,尝试多次后DeepSeek均显示服务器繁忙,请稍后再试,火爆程度可见一斑。

拼多多路径

需要强调的是,中国的大语言模型并非最顶尖的,但它们的制造成本要低得多,《经济学人》举例,阿里旗下的通义千问QwQ-32B-Preview于2024年11月推出,与美国的顶尖模型相比,差距不到3个月,DeepSeek在一项标准评估中排名第七。

报道称,DeepSeek是由2000多块二流芯片训练而来,Meta的模型则用了1.6万块顶尖芯片。在某些排名中,DeepSeek的表现甚至超过了Meta的模型。训练一个美国的大语言模型成本高达数千万美元,而且还在上升,而DeepSeek方面表示,其训练成本不到600万美元。

提到DeepSeek火爆的原因,工信部信息通信经济专家委员会委员盘和林表示,DeepSeek采取低价和开源两条路并行的策略,尤其是开源,之前全球AI开发者都要看Meta的脸色,因为最有名的开源模型是Llama,有了DeepSeek,Llama立马不香了,而那些收费较高的,如ChatGPT则受到较大打击,免费和收费哪个香?很容易作出决断,DeepSeek也算中国第一个打通国内国外应用生态的产品。

模型成本的下降对产业链上的云服务厂商存在利好。在比达分析师李锦清看来,这正是云厂商火速接入DeepSeek的原因,站在市场竞争力与商业价值看,接入DeepSeek模型有助于云厂商提升自身在AI领域的竞争力,吸引更多开发者和企业客户。通过提供DeepSeek模型的部署和应用服务,云厂商可以拓展业务范围,增加收入来源。

记者 魏蔚

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/21458.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年2月6日 上午9:47
下一篇 2025年2月6日 上午9:49

相关推荐

  • 跨境支付市场硝烟再起

    跨境支付圈近两日一则消息引发关注,两家支付公司竟打起来了。近日,国内跨境支付公司杭州乒乓智能技术有限公司(以下简称PingPong)以商业诋毁纠纷为由,将上海夺境网络技术有限公司(以下简称夺境)、上海夺汇网络技术有限公司(以下简称夺汇)诉至杭州市滨江区人民法院。 一场官司引发市场对两方公司的热议,从业务来看,二者存在不少重合度。专家分析,此次行业头部企业对簿…

    2025年9月17日
    8500
  • 上演“关联式”IPO 瑞立科密带伤上会

    在问询阶段排队逾一年后,广州瑞立科密汽车电子股份有限公司(以下简称瑞立科密)即将迎来冲A的下一关键节点,公司深市主板IPO将于4月18日上会迎考。值得一提的是,本次冲击上市背后,瑞立科密与其控股股东瑞立集团有限公司(以下简称瑞立集团)存在着密切的业务往来。2020—2023年,公司向瑞立集团及其下属企业累计销售金额超10亿元;累计采购原材料金额超…

    2025年4月17日
    16200
  • 大吉巷开业 “城市会客厅”进入大比拼

    5月25日,位于北京二环内的中海大吉巷项目正式开业。作为北京近年来在城市核心区域的新建项目,中海大吉巷项目定位为城市文化会客厅。记者走访看到,因新开业,项目吸引不少消费者进场。据介绍,中海大吉巷为文保区+商业+商办+公园的复合型商业形态。不过,越来越多的商业项目注重在地文化与城市规划的融合,将城市会客厅作为自身定位,未来大吉巷想要脱颖而出,仍需思考如何与周边…

    2025年5月26日
    12900
  • “消失”的村镇银行去哪了

    2006年,村镇银行肩负激活农村金融市场的使命诞生,成为服务三农的重要力量。然而,随着时间推移,抗风险能力弱、业务创新不足、股东关系复杂等问题接踵而至,一场场并购整合由此展开。众多村镇银行消失解散,成为各大银行的分支机构。从常熟农商行的跨行收编,到北京、天津、河北、山西各地城、农商行入局,收购与重组案例不断涌现。一系列变革的背后,消失的村镇银行走向何方?在整…

    2025年2月28日
    16900
  • 卡在“注册关”的江顺科技

    自2024年1月提交注册后,江苏江顺精密科技集团股份有限公司(以下简称江顺科技)主板IPO仍未注册生效,至今已一年有余。记者注意到,卡在注册关的江顺科技此次冲A存在诸多疑点,一方面,公司IPO前曾连续进行大手笔分红,此次冲击上市还拟募资补流;另一方面,公司资产负债率高于可比上市公司平均水平,流动比率、速动比率低于可比上市公司平均水平。此外,报告期内,公司前五…

    2025年2月6日
    15700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信