业内:DeepSeek或准备适配国产GPU 绕过CUDA展现工程实力

尽管春节假期已经过半,但“来自东方的神秘力量的 DeepSeek”仍在全球范围内引起热议。各路业内人士从不同角度分析 DeepSeek 的模型和技术。

业内:DeepSeek或准备适配国产GPU

韩国 Mirae Asset Securities Research 的一名分析师在 X 撰写长文分析称,这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程实现的,而非通过 CUDA 中的某些功能。CUDA 是由英伟达开发的一种通用编程框架,允许开发者利用 GPU 进行通用计算。如果 DeepSeek 绕过了 CUDA,这说明其研发团队在大模型训练中采用了不同的技术路径。

业内:DeepSeek或准备适配国产GPU 绕过CUDA展现工程实力

对于程序开发人员来说,CUDA 类似于一种高级语言,降低了开发难度,使开发者能够专注于算法逻辑而无需过多考虑硬件执行细节。例如,使用高级语言进行变量赋值操作只需一条命令,而用汇编语言则需要多条指令并理解寄存器、内存等概念。因此,CUDA 便于开发基于 GPU 的算法设计。

业内:DeepSeek或准备适配国产GPU 绕过CUDA展现工程实力

大模型开发商通常基于 CUDA 进行研发,因为 CUDA 已经封装了一些常用函数,简化了开发过程。然而,这种通用性也带来了一定的灵活性损失。对于有特定需求的开发者,如需要精细化控制多个 GPU 之间的数据传输,CUDA 可能无法提供高效的解决方案。

当使用单个 GPU 时,CUDA 非常适用。但在多节点多 GPU 环境下,CUDA 的抽象层面效率较低。开发者可以通过组合 GPU 驱动提供的函数接口来提高效率,或者直接调用底层硬件接口以实现更高效的大模型研发。绕过 CUDA 可以直接根据 GPU 的驱动函数进行新的开发,从而实现更加细粒度的操作。

DeepSeek 在多节点通信时绕过了 CUDA 直接使用 PTX,这使得模型训练速度更快。这意味着在相同时间内可以处理更多数据,间接提高了模型效果。绕过 CUDA 并非新鲜做法,一些开源框架如 Triton 也在尝试替代 CUDA。

AI 技术人员在本科阶段通常接触的是基于深度学习框架(如 Python)的神经网络训练,很少直接编写 CUDA 相关的 C++ 代码。工作后,他们可能因项目需求接触到针对具体硬件资源的编程,但通常不需要绕过 CUDA 来写模型训练算法。然而,由于算力短缺等原因,大模型训练确实需要更高效的算力利用方法。

DeepSeek-V3 的技术报告提到使用了英伟达的 PTX 语言。相比 CUDA 提供的编程接口,PTX 能更精细地控制 GPU 之间的数据传输,但也要求更高的专业技能。绕过 CUDA 的做法具有一定的技术难度,需要开发者既懂 AI 算法又懂计算机系统架构。DeepSeek 显然招聘了具备这些技能的人才,并将他们有效地组织起来。

此外,DeepSeek 的技术报告表明其主体实现仍基于 CUDA 接口,但在通信部分绕开了 CUDA。这意味着 DeepSeek 拥有一些擅长写 PTX 语言的内部开发者。未来,若使用国产 GPU,DeepSeek 将更容易适配这些硬件。从工程角度看,DeepSeek 的技术非常有技巧,且已与 AMD 合作,未来可能与其他 GPU 厂商合作。韩国分析师认为,这反映了 DeepSeek 在面对“GPU 短缺危机”时展现出的紧迫感和创造力。

责任编辑:张蕾

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/16489.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年2月1日 上午11:25
下一篇 2025年2月1日 上午11:25

相关推荐

  • 闲鱼向外贸中小商家、个人卖家开放专属入驻通道,最快24小时入驻

      格隆汇4月21日|闲鱼今日启动“出口转内销”扶持计划,面向外贸中小商家和个人卖家提供“绿色通道入驻鱼小铺、‘外贸小铺’专属认证、闲鱼首页上线‘外贸优选’专区、打造闲鱼外贸节”四大举措,助力其消化库存、打开新销路,快速“外转内”。   首先是帮助国内线上销售经验不足的外贸卖家疏通转内通路。目前,闲鱼已设立鱼小铺快速入驻通道,由专人审核,且无论是外贸中小商家…

    2025年4月21日
    12300
  • DeepSeek已暂停API服务充值 服务器资源紧张所致

    2月6日,DeepSeek已暂停API服务充值,按钮显示为灰色不可用状态。官方声明称,由于当前服务器资源紧张,为了避免对用户业务造成影响,他们已经暂停了API服务充值。不过,用户仍然可以使用已充值的金额继续调用服务。 根据官方价目表,deepseek-chat模型的优惠期将持续到北京时间2025年2月8日24:00。优惠结束后,将按照每百万输入tokens …

    2025年2月6日
    13500
  • 当地回应两县级领导同名同姓 罕见现象引热议

    在山西省繁峙县政府领导班子中,县长与副县长都叫赵斌,这一罕见现象引起了网友们的关注。有人表示这种巧合很难遇到,也有人好奇如果单位里喊一声“赵县长”,两人是否会同时回头,还有人疑惑他们的签名是否相似。 山西繁峙县政府官网上显示,这对同名的“赵斌县长”组合仍在履职。尽管名字相同,但两人的出生年月、学历和分管工作领域不同。县长赵斌出生于1981年12月,拥有博士研…

    2025年2月8日
    15600
  • NBA升级犯规!卢尼推搡浓眉被升级为一级恶意:这个动作太危险 官方赛后重新定级

    北京时间1月27日,NBA官方宣布将卢尼在湖勇二番战中对浓眉的一次犯规升级为一级恶意犯规。该犯规发生在第一节比赛结束前3分05秒,当时浓眉快攻准备上篮,卢尼从身后推搡导致浓眉摔出底线。裁判当时判罚普通犯规,浓眉获得两次罚球机会。赛后经过回放审核,卢尼的动作被重新定级为一级恶意犯规。 比赛中,湖人上半场仅领先勇士1分,但下半场逐渐拉开分差,最终以118-108…

    2025年1月27日
    13800
  • 上海大胜北京引热议!媒体人调侃:洛夫顿没怎么发力就准三双 洛夫顿全能表现率队晋级

    上海大胜北京引热议!北京时间2月12日,CBA俱乐部杯半决赛正式开打,上海男篮以96-73击败北京男篮,顺利晋级决赛,将与新疆男篮争夺首届杯赛冠军。比赛中,北京首节打出11-1的梦幻开局,但随后进攻哑火被反超。首节结束时上海领先8分,次节北京继续表现不佳,半场仅得31分,上海建立起17分的领先优势。下半场分差进一步扩大到30分以上,比赛早早失去悬念,最终上海…

    2025年2月13日
    19300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信