业内:DeepSeek或准备适配国产GPU 绕过CUDA展现工程实力

尽管春节假期已经过半,但“来自东方的神秘力量的 DeepSeek”仍在全球范围内引起热议。各路业内人士从不同角度分析 DeepSeek 的模型和技术。

业内:DeepSeek或准备适配国产GPU

韩国 Mirae Asset Securities Research 的一名分析师在 X 撰写长文分析称,这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程实现的,而非通过 CUDA 中的某些功能。CUDA 是由英伟达开发的一种通用编程框架,允许开发者利用 GPU 进行通用计算。如果 DeepSeek 绕过了 CUDA,这说明其研发团队在大模型训练中采用了不同的技术路径。

业内:DeepSeek或准备适配国产GPU 绕过CUDA展现工程实力

对于程序开发人员来说,CUDA 类似于一种高级语言,降低了开发难度,使开发者能够专注于算法逻辑而无需过多考虑硬件执行细节。例如,使用高级语言进行变量赋值操作只需一条命令,而用汇编语言则需要多条指令并理解寄存器、内存等概念。因此,CUDA 便于开发基于 GPU 的算法设计。

业内:DeepSeek或准备适配国产GPU 绕过CUDA展现工程实力

大模型开发商通常基于 CUDA 进行研发,因为 CUDA 已经封装了一些常用函数,简化了开发过程。然而,这种通用性也带来了一定的灵活性损失。对于有特定需求的开发者,如需要精细化控制多个 GPU 之间的数据传输,CUDA 可能无法提供高效的解决方案。

当使用单个 GPU 时,CUDA 非常适用。但在多节点多 GPU 环境下,CUDA 的抽象层面效率较低。开发者可以通过组合 GPU 驱动提供的函数接口来提高效率,或者直接调用底层硬件接口以实现更高效的大模型研发。绕过 CUDA 可以直接根据 GPU 的驱动函数进行新的开发,从而实现更加细粒度的操作。

DeepSeek 在多节点通信时绕过了 CUDA 直接使用 PTX,这使得模型训练速度更快。这意味着在相同时间内可以处理更多数据,间接提高了模型效果。绕过 CUDA 并非新鲜做法,一些开源框架如 Triton 也在尝试替代 CUDA。

AI 技术人员在本科阶段通常接触的是基于深度学习框架(如 Python)的神经网络训练,很少直接编写 CUDA 相关的 C++ 代码。工作后,他们可能因项目需求接触到针对具体硬件资源的编程,但通常不需要绕过 CUDA 来写模型训练算法。然而,由于算力短缺等原因,大模型训练确实需要更高效的算力利用方法。

DeepSeek-V3 的技术报告提到使用了英伟达的 PTX 语言。相比 CUDA 提供的编程接口,PTX 能更精细地控制 GPU 之间的数据传输,但也要求更高的专业技能。绕过 CUDA 的做法具有一定的技术难度,需要开发者既懂 AI 算法又懂计算机系统架构。DeepSeek 显然招聘了具备这些技能的人才,并将他们有效地组织起来。

此外,DeepSeek 的技术报告表明其主体实现仍基于 CUDA 接口,但在通信部分绕开了 CUDA。这意味着 DeepSeek 拥有一些擅长写 PTX 语言的内部开发者。未来,若使用国产 GPU,DeepSeek 将更容易适配这些硬件。从工程角度看,DeepSeek 的技术非常有技巧,且已与 AMD 合作,未来可能与其他 GPU 厂商合作。韩国分析师认为,这反映了 DeepSeek 在面对“GPU 短缺危机”时展现出的紧迫感和创造力。

责任编辑:张蕾

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/16489.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年2月1日 上午11:25
下一篇 2025年2月1日 上午11:25

相关推荐

  • 外国影迷看《哪吒2》感动落泪 中国神话触动全球心灵

    中国动漫电影《哪吒2》不仅在国内取得了票房佳绩,还赢得了外国影迷的赞誉。影片票房已突破100亿,并且仍在持续增长。 一位外国影迷表示,《哪吒2》是他看过的最棒的动画影片,甚至超过了他以往对“漫威超级英雄”的喜爱。他认为所谓的绝对正义已经变得无趣。而《哪吒2》中的每个角色都游走在善与恶之间,这种复杂性让影片显得更加真实和深刻。 这部电影通过一个中国神话故事展现…

    2025年2月15日
    16200
  • 灰熊120-119战胜火箭 末节绝杀逆转胜

    1月31日,灰熊在联邦快递论坛球馆迎战火箭。两队都面临核心球员缺阵的情况:灰熊的莫兰特因肩伤休战,火箭的申京也未能出战。此前的三次交手中,火箭均战胜灰熊,场均净胜12.3分。这场比赛还有一大看点是火箭旧将狄龙-布鲁克斯首次以对手身份重返孟菲斯,赛前热身时遭到部分球迷嘘声。 比赛一开始,双方迅速进入对攻模式。灰熊依靠贝恩的挡拆中距离连得6分,火箭则凭借杰伦-格…

    2025年1月31日
    20400
  • 为激发适婚人群结婚热情,提高出生率!韩国人结婚奖励至多2000万韩元,还能领约会经费及蜜月旅行支出等费用

      格隆汇5月26日丨为激发适婚人群的结婚热情,从而提高出生率,缓解人口老龄化,韩国政府想出多种办法。近日,韩国不少地方政府就宣布,为新婚夫妇提供现金奖励。据《韩国时报》,韩国釜山市沙下区政府不久前为年轻人举办了相亲活动,并承诺在该活动上相亲成功并最终结婚的年轻人,可以获得至多2000万韩元(约合人民币10.5万元)的奖励。此外,当地政府还可以为新人报销11…

    2025年5月26日
    10700
  • 焦点访谈·足迹丨文脉赓续 继往开来

    在陕西宝鸡,艺术家将流传了千年的社火表演脸谱画在了水瓢上,成为了精美的艺术品——马勺脸谱。在宝鸡,流传千年的还有许多国宝级的青铜器,它们都是中华文明源远流长的印记。民族要振兴,中华文明的传承必不可少。 2024年,习近平总书记来到这里,参观了宝鸡青铜器博物院,在这里传承中华文明的文物前驻足凝视。这一年,习近平总书记在国内考察调研时,对中华优秀传统文化念兹在兹…

    2025年2月4日
    12200
  • 00后小伙用无人机吊运竹子:月赚4万,29岁创业者:助农比当网红重要,已帮30户老人

    近日,网友 “自贡树哥” 陈文建的一条短视频火了 —— 四川宜宾南溪区的山林里,大疆 T100 无人机 “呼呼” 转动螺旋桨,吊着三四米长的竹子从坡上飞起,稳稳落到公路上,装、卸全程不过 50 秒。这条记录无人机服务 “三农” 的视频,引来了无数网友点赞,也有人质疑他 “制造噱头想当网红”。10 月 14 日,29 岁的陈文建面对红星新闻记者,讲起了自己从城…

    2025年11月2日
    15100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信