DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥

DeepSeek V3.1发布后,一则官方留言让整个AI圈都轰动了:

DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥

新的架构、下一代国产芯片,总共短短不到20个字,却蕴含了巨大信息量。

国产芯片企业股价也跟风上涨,比如寒武纪今日早盘盘中大涨近14%,总市值跃居科创板头名。

半导体ETF,同样也是在半天的时间里大涨5.89%。(不知道作为放出消息的DeepSeek背后公司幻方量化,有没有趁机炒一波【手动狗头】)

DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥

这个UE8M0 FP8到底是个啥?下一代国产芯片,又是指什么?

接踵而来的疑问,挤爆了人们的大脑。

DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥

在知乎上,也有不少大神开始边科普边分析自己对这件事的理解。

DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥

咱抱着学习心态,不妨就从UE8M0 FP8的概念开始说起。

什么是UE8M0 FP8?

UE8M0 FP8这个概念,可以拆分成前后两个部分来解释,前面的UE8M0,是MXFP8路径里的缩放因子。

MXFP8是Open Compute Project在2023年发布的《Microscaling (MX) Formats Specification v1.0》里定义的8 bit微缩块格式。

Open Compute Project是2011年由Facebook(现Meta)联合英特尔、Rackspace等发起的开源硬件协作计划,目的是通过共享数据中心及服务器设计推动行业效率提升。

其成员阵容相当强大,国外还有微软、谷歌、亚马逊、AMD、英伟达等,而国内的阿里、腾讯、百度等也参与其中。

说回MXFP8,它以FP8为基础建立,FP8是把常规浮点格式压缩到8 bit的一种编码方式。

MXFP8的核心思想是先把张量切成固定长度的块,然后为每个块单独指定一个2的整数次幂作为缩放因子,把块内所有数一起除以这个系数后再写成FP8。

这种块级(而不是全张量级)的缩放,让MXFP8既保留了8 bit位宽,又把可用动态范围扩展了几十倍。

DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥
△来源:英伟达技术博客

而这里的缩放因子也是包含8个bit,其中包含符号位、指数位和尾数位,开发者可以自行将这8个bit分配给这三种不同的位。

其中符号位只区分有无,若有则占一个bit,无则不占用,而UE8M0中的U表示的就是无符号(有符号可表示为S或省略不写)。

E和M则分别表示指数位和尾数位分配到的bit数,E8M0指的就是8个bit全都分配给了指数位。

其他常用的格式还有E4M3、E5M2(缩放引子外的本体部分也常采用这两种)等,它们均包含符号位,其余7个bit在指数和尾数位之间分配。

DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥

DeepSeek之前开源的5.6k星标项目FP8 GEMM内核DeepGEMM就已经支持UE8M0,不过这个项目主要是适配英伟达芯片和CUDA生态。

DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥

那么,采用这种全指数表示缩放因子的方式,有什么好处呢?

首先,由于UE8M0不含尾数与符号位,处理器在根据缩放因子对数据进行复原时,只需要乘以对应的2的幂,也就是移动一下指数位,而不需要浮点乘法、规格化或舍入逻辑,缩短了时钟关键路径。

并且UE8M0的动态范围覆盖2^(?127)到2^128,其指数表可轻松容纳这一跨度,为后续块缩放提供充足空间。

另外UE8M0还能解决单尺度FP8无法同时顾及大/小值,导致溢出或被压成0的问题,将UE8M0作为分块的尺度后,错误率曲线从整张曲线下降到一条远低水平的横线,在保持8 bit张量精度的同时大幅减少信息损失。

DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥
△来源:英伟达技术博客

UE8M0 FP8的好处我们了解了,现在可以解释为什么它更适配下一代国产芯片了。

大部分已量产的国产AI加速器仍沿用FP16/BF16 + INT8的计算通路,并未集成E4M3/E5M2这类完整的FP8乘加单元。

不过,摩尔线程MUSA 3.1 GPU、芯原VIP9000 NPU等2025 H2首发的新款国产芯片已经在宣传资料里列出原生 FP8或Block FP8支持,并与 DeepSeek、华为等15家厂商联合验证UE8M0格式。

虽然下一代国产芯片虽然已经在为FP8做出准备,但HBM/LPPDDR带宽仍然与顶尖芯片存在较大差距。

而UE8M0让一组32个FP8数据只追加8bit缩放引子,相比传统的4B(32bit) FP32缩放直接节省75%的流量,这种空间节约措施被视作下一代架构的重要优化方向。

DeepSeek为哪个国产芯片做了优化?

在搞清楚啥是UE8M0 FP8之后,回过神来的网友们又开始纷纷猜测:

DeepSeek这是在说哪一家的国产芯片呢?

在官方有意卖关子的情况下,人们只好首先把目光放在了首批通过DeepSeek大模型适配的8家厂商。

DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥
△来源:中国信通院官微

这当中大家看好的头号种子选手当属寒武纪,市场反应相当直观——

截至今日10:25,寒武纪盘中大涨近14%,总市值超4940亿元,超过中芯国际跃居科创板头名(实际以最新为准)。

理由也很简单,该公司旗下的MLU370-S4、思元590及最新690系列芯片均支持FP8计算,在架构设计和低精度计算优化上一直相对比较领先。

而基于类似理由,海光、沐曦,中昊芯英甚至包括名单之外的摩尔线程等也都被网友们挨个点名:

海光:其深算三号DCU支持FP8计算,存在进一步优化的空间;沐曦:今年7月发布的曦云C600,也支持FP8精度计算;中昊芯英: 其刹那TPU AI芯片支持FP8精度;摩尔线程:作为国内极少数原生支持FP8的GPU厂商,旗舰产品MTT S5000支持FP8精度计算。

与此同时,一些很有可能即将上车FP8的厂商也出现在了一众盘点名单中。

例如华为昇腾,虽然昇腾910B和910C暂不支持原生FP8,但官方路线图已经写明2025Q4原生FP8,所以众人预计或将在2026年推出的910D(可能的命名)很有可能是所谓的下一代芯片。

除了以上这些,还有一大串芯片厂商的名字出现在了讨论当中,堪称盛况空前。

虽然猜来猜去没有最终定论,但不妨碍市场给予热烈回应。根据最新消息,今日国产芯片概念集体高开,科创50大涨3%创近三年半新高,芯片产业链集体走强。

DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥

所以,大家为什么集体狂欢?这些国产芯片一旦支持UE8M0 FP8究竟意味着什么?

综合当前国内外各方说法来看,一切都可以用一句话来概括:

这代表了国产AI正走向软硬协同阶段,能够实质性减少对英伟达、AMD等国外算力的依赖。

这里头的逻辑也很简单清晰,正是由于UE8M0 FP8精度格式所具备的上述优势(更小的带宽、更低的功耗、更高的吞吐),这意味着同样的硬件今后能跑更大的模型,所以国产芯片的性价比被大幅拉高了。

换句话说,这些国产芯片厂商将在竞争中更具优势,因此也就属于利好了。

从另一方面来看,DeepSeek通过改动精度格式,相当于主动贴合国产芯片的最佳性能点,这种软硬协同的模式无疑是把国产芯片们拉进了一个统一的生态坐标系。

这就像当年的Wintel联盟一样——微软和英特尔通过深度技术绑定,筑起了个人计算机领域的生态护城河,只不过如今换成了DeepSeek和国产芯片厂商们。

One More Thing

事实上,官方在正文部分提到UE8M0 FP8的只有一句话:

需要注意的是,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。

而且位置相当隐蔽,藏在了一大段洋洋洒洒的功能更新介绍之后。

DeepSeek一句话让国产芯片集体暴涨!UE8M0 FP8到底是个啥

要不是官方特意在评论区补了一句,估计大家还没啥感觉。

所以你说它这个动作吧,不知道算无意还是刻意为之,总之是相当微妙了(手动狗头)。

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/91895.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年8月22日 下午3:00
下一篇 2025年8月22日 下午3:00

相关推荐

  • 媒体言论引爆玩家热议:中国游戏将主导游戏行业吗

    日前我们曾报道,媒体PCGamer发布了分析,指出中国PC游戏行业正经历一场历史性的变革,并预测其将在未来十年内占据全球主导地位。 这一言论立刻在海外社交媒体上引发了热烈讨论,玩家们纷纷留言,分享他们对中国游戏崛起的看法。 对于这番主导论,海外玩家的观点呈现出多元化的趋势: 许多玩家认为,亚洲开发者正超越大部分西方同行,原因很简单——…

    2025年8月27日
    12700
  • 每年至少骑行上万公里:63岁机车网红张金成疑意外离世

    4月14日消息,这两天,众多网友发文悼念机车老炮儿张金成,其疑似因骑车意外摔伤离世,享年63岁。 有现场目击者称,4月12日凌晨,张金成在张家口草原天路一处急弯路段骑行时,他所骑的重达300kg的机车过弯时突然失控,重重撞上护栏,由于伤势过重最终离世。 报道称,他原本计划4月15日带队去新疆搞公益骑行,连路线都规划好了,出事前两天,张金成还发了朋友圈,配了段…

    2025年4月14日
    11200
  • 男子从北京跑步抵达郑州 22天跑700公里 跑费两双鞋 当事人:每天跑30多公里

    9月1日消息,近日,一位网友在社交平台发布视频,分享了自己用 22 天从北京跑步前往郑州的经历,引发网友们的广泛热议。 随后,这位当事人接受了媒体访谈,道出了跑步行程的初衷:他渴望以自己最热爱的方式,去不同的城市走一走,看一看。 据悉,此次总行程长达 700 多公里,他每日坚持跑 30 多公里,耗时约 4 个多小时,整个旅程总花费约 4000 元。 男子介绍…

    2025年9月1日
    11300
  • 开学季最香RTX 5060游戏本:七彩虹将星X16系列新品上市 国补后6399元起

    9月8日消息,七彩虹旗下高端电竞本将星系列两款新品将星X16 Pro与X16将在今晚20:00开启预约。 本次升级中变化最大的就是将星X16 Pro,外观设计以白色系为主色调,推出全新星耀白国风外观,机身A面采用阳极氧化工艺,辅以全新将标识。 核心配置方面,将星X16 Pro搭载酷睿i7-14650HX处理器,拥有16核24线程,最高睿频5.2GHz,适合游…

    2025年9月8日
    9200
  • 14500锂电池+3年质保:雅格电蚊拍11.9元新低

    天猫雅格家居旗舰店,雅格电蚊拍特价活动款日常售价25.9元,下单领取13元优惠券+叠加立减,到手价11.9元新低。 另有Type-c 快充款 + 3 元起可选。 14500 锂电池+充满电转灯提醒+电蚊拍充满电,15 天手动灭蚊时长。 购买链接:天猫(券后11.9元) 购买提醒:天猫雅格家居旗舰店商品,正品保障,支持七天无理由退换,赠退货宝,请查看最新评价后…

    2025年3月31日
    17000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信