DeepSeek-V3.2-Exp模型正式发布 稀疏注意力能否改写行业规则

9月29日,深度求索(DeepSeek)正式推出实验性版本DeepSeek-V3.2-Exp。这款被业内视为“新一代架构过渡之作”的模型,不仅引入了全新的稀疏注意力机制,更将API调用成本直接砍半——这是要彻底打破大模型“算力军备竞赛”的魔咒吗?

DeepSeek-V3.2-Exp模型正式发布 稀疏注意力能否改写行业规则

稀疏注意力首秀 长文本处理效率跃升

作为V3.1-Terminus的迭代版本,V3.2-Exp最核心的突破在于引入DeepSeek Sparse Attention(DSA)稀疏注意力机制。不同于传统Transformer架构中“全量计算”的模式,DSA通过细粒度稀疏化注意力矩阵,在处理长文本时将计算量从“平方级增长”压缩至“线性可控”。官方测试显示,在保持与V3.1-Terminus性能基本持平的前提下,模型训练和推理效率实现显著提升。

DeepSeek-V3.2-Exp模型正式发布 稀疏注意力能否改写行业规则

具体来看,在数学推理领域,AIME2025评测分数从88.4提升至89.3;编程能力方面,Codeforces竞赛评级从2046分跃升至2121分,相当于从“专业级”向“专家级”迈进。更关键的是,这种提升并非依赖参数规模扩张——该模型总参数量仍为671B,激活参数37B,却实现了160K长序列上下文的高效处理,这意味着能一次性“消化”30万字文档或超长篇代码库。

“传统注意力机制处理10万字文本时,计算量会飙升至1万亿次,而DSA能将其控制在2000亿次以内。”DeepSeek技术团队在论文中解释,这种优化源于对注意力矩阵的“动态剪枝”,仅保留关键关联权重,从而在精度损失小于1%的情况下,将硬件资源占用降低40%。

API成本腰斩 华为云适配加速商业化落地

伴随技术突破的,是极具冲击力的商业举措。DeepSeek宣布,V3.2-Exp API调用成本降低50%以上,新价格即刻生效。以“未命中缓存输入”为例,原单价从2元/百万tokens降至1元,输出价格从8元/百万tokens降至4元,直接对标行业最低水平。

DeepSeek-V3.2-Exp模型正式发布 稀疏注意力能否改写行业规则

更值得关注的是生态进展。华为云已完成对该模型的全面适配,采用大EP并行方案支持160K长序列处理。“这相当于让模型‘一口气读完《战争与和平》并精准回答细节问题’。”华为云AI负责人在接受采访时表示,双方联合优化的推理引擎,可将长文本处理延迟控制在500ms以内,满足企业级实时交互需求。

开发者社区反应热烈。某电商技术负责人透露:“之前用同类模型处理用户行为日志,单次调用成本约12元,现在用V3.2-Exp能压缩到5元以内,年节省近百万。”官方同步提供V3.1-Terminus接口供对比测试,截至发稿,Hugging Face开源页面星标数已突破1.2万,GitHub代码库fork量超3000次。

557万美元训练成本 挑战算力军备竞赛

“用557万美元实现与GPT-4o相当的性能”——这一标签自DeepSeek-V3系列发布以来便引发行业震动。此次V3.2-Exp进一步验证了“高效训练”路线的可行性:通过算法优化而非堆砌算力,将大模型研发从“百亿美金游戏”拉回“千万美元级别”。

外媒The Verge将其称为“东方的神秘力量”,OpenAI前员工Andrej Karpathy在X平台评价:“他们证明了智能增长未必依赖算力指数级提升,稀疏化架构可能是下一个突破口。”这种技术路径正倒逼行业反思:当参数规模触及物理极限,效率优化会成为新的竞争焦点吗?

不过,实验性版本的定位也意味着挑战。官方强调,尽管公开评测表现稳定,但真实场景下的大规模验证仍需时间。“我们保留V3.1接口,就是希望开发者帮助我们发现极端场景下的问题。”DeepSeek产品负责人表示,未来三个月将根据反馈迭代,目标是2026年Q1推出正式版。

从“算力至上”到“效率为王”,DeepSeek的这次“实验”或许正在撕开一道口子。当稀疏注意力、低成本训练、开源生态形成合力,AI行业的“军备竞赛”会转向“效率竞赛”吗?至少现在,答案已经写在了API降价50%的公告里。

 

本文来自投稿,不代表火星财经立场,如若转载,请注明出处:https://www.sengcheng.com/article/101808.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
中国商界杂志社的头像中国商界杂志社
上一篇 2025年9月29日 下午6:34
下一篇 2025年9月29日 下午6:37

相关推荐

  • 新款领克08 EM-P正式上市:激光雷达全系给,算力最高 700TOPS,限时 15.98 万起击穿底价

    2025 年 9 月 24 日晚,领克汽车的上市发布会让 20 万级混动 SUV 市场彻底沸腾 —— 新款领克 08 EM-P 携 4 款车型正式登场,17.58-22.88 万元的指导价被 15.98-21.28 万元的上市限时价直接击穿,更狠的是,这款车把同级罕见的激光雷达做到了全系标配,硬生生将高端智能配置拉进了普通家庭的购车预算。 走进实车,最先被唤…

    2025年9月25日
    12300
  • 迈腾3000 万辆甄选款 17.49 万起,蓝牙钥匙 + 84 期贷,比雅阁长 41mm

    10月12日,一汽-大众突然向B级车市场投下一颗“重磅炸弹”!为纪念品牌累计销量突破3000万辆,官方直接推出迈腾3000万辆甄选款,三款车型17.49万起售,不仅把蓝牙数字钥匙、L2级驾驶辅助这些硬核配置拉满,还甩出0首付84期融资、最高1.5万置换补贴的“组合拳”。要知道,作为常年稳坐B级车销量前三的“国民车型”,迈腾这次带着“3000万辆”的底气搞升级…

    2025年10月13日
    10800
  • 2026款宝马X5上市:智驾Pro免费送,售价反降5万

    2025年11月20日,宝马中国突然宣布2026款X5正式上市,三款车型售价区间59.8-74.8万元,较老款起售价直降4.2万元。这场没有预热的价格突袭,伴随着智能驾驶辅助系统Pro、前排座椅通风等20项配置的全系标配,让这款年销超5万台的中大型豪华SUV再次成为车市焦点。更令人意外的是,宝马同步宣布取消入门版车型,将资源集中在更具竞争力的主力配置上,这种…

    2025年11月20日
    10300
  • 阿尔法T5增程版续航1215km,10月底上市,亏电加速7.6秒

    10月11日,北汽极狐正式对外宣布,旗下首款增程车型——全新阿尔法T5增程版将于10月底正式上市。作为品牌在新能源赛道的重要布局,这款中型SUV从曝光之初就备受关注,而随着核心参数的公布,市场对它的期待值更是直线上升。毕竟在当下新能源市场,”续航焦虑”仍是多数消费者的痛点,而阿尔法T5增程版抛出的”CLTC纯电215km+…

    2025年10月11日
    11900
  • SB OpenAI Japan正式成立!

    火星科技2月3日消息,今日,软银集团宣布与OpenAI建立合作伙伴关系,共同开发和销售名为“Cristal intelligence”的高级企业人工智能。 据悉,软银将每年斥资30亿美元在其集团公司中部署OpenAI的解决方案。 此外,软银和OpenAI还宣布成立一家新的合资企业,名为“SB OpenAI Japan”,将专门向日本的大型企业推广OpenAI…

    2025年2月3日
    14600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信