宋洁:人工智能大模型如何实现算力低耗能

 

筑牢算力底座是释放数据要素价值的关键。近期,随着人工智能大模型的爆发式涌现和快速迭代,算力需求已呈现指数级增长。国际数据公司(IDC)与浪潮信息联合发布的《2025年中国人工智能计算力发展评估报告》预测,2023年至2028年,中国智能算力规模将以年复合增长率46.2%的速度扩张,为充分发挥人工智能大模型的生成能力提供了重要的基础能力支撑。

人工智能大模型面临算力高耗能挑战

在智能算力快速增长背后暗藏隐忧,算力基础设施的高能耗与低碳可持续发展目标间的矛盾日益尖锐。根据《算力基础设施高质量发展行动计划》,算力或计算力是数据中心服务器对数据处理并实现结果输出的一种能力,是衡量数据中心计算能力的一个综合指标,包含通用计算能力、超级计算能力和智能计算能力。在作为算力枢纽的数据中心,算力能耗包含直接电力消耗与冷却系统能耗两部分,本质上是“比特到瓦特”的能量转换。而计算模型能力的提升往往依赖于不断增长的算力投入,在以人工智能为代表的许多前沿科技领域,模型的能力获得了优先考虑而能耗则经常被忽视。以大模型训练为例,OpenAI公司训练GPT-4的能耗高达2.4亿度电,凸显了算力扩张与能源约束的尖锐矛盾。当前,人工智能大模型既是算力需求的主要推手,也成为破解能耗困局的关键。通过算法优化、基础设施升级与观念革新,实现算力低能耗化,已成为推动数字经济可持续发展的必然选择。

从算法到硬件的系统性技术革新

降低模型计算量是实现算力低能耗的核心路径。通过算法创新,可在不牺牲性能的前提下减少算力消耗。例如,模型剪枝算法通过剔除冗余参数,将深层网络转化为精简的“小模型”;模型蒸馏技术则将大模型的知识迁移至轻量级模型,显着降低推理能耗。更具突破性的是动态参数激活机制的应用。以深度求索公司发布的6710亿参数大模型DeepSeek-R1为例,其创新性地采用“按需激活”策略,每次仅调用少量活跃参数,实现了性能与能耗的平衡。此外,低精度计算(如FP16或INT8)的普及,通过减少浮点运算位数,进一步降低了算力需求。这些技术的融合,标志着算法层面的节能革命已从理论走向实践。

算力基础设施的能耗效率(即单位算力能耗)是另一关键维度。一方面,硬件设计需兼顾通用性与专用性。针对AI模型的并行计算特性,异构计算芯片(如GPU、NPU)的能效比显着优于传统CPU,而类脑芯片的探索则更具颠覆性。在2025全国类脑智能产业创新发展推进会上展示的脉冲神经网络芯片,通过模拟人脑稀疏激活机制,将能效提升1——2个数量级,为突破“算力——能耗”瓶颈提供了新方向。另一方面,算力集群的集约化布局亦是关键。“东数西算”工程规划布局了八大算力网络国家枢纽节点,分为东部实时性算力集群与西部非实时性算力保障基地两大类,旨在优化全国算力资源布局,推动绿色集约化发展。例如,我国首个洞库式数据中心,结合山洞山体特性,采用冷热通道分离设置等设计手法,能源效率指标达到国际先进水平。人工智能大模型本身可成为算力低能耗化的工具。通过实时分析任务负载,大模型能动态调度算力资源,在低负载时段关闭冗余服务器,在高峰前唤醒备用设备,避免“空转”浪费。例如,我国有的大型调度平台,通过智能算法将通用、智能、超级算力与量子算力协同分配,使算网一体化效率提升20%。在硬件层面,AI与冷却系统的联动也潜力巨大,例如在数据中心通过AI预测服务器温度变化,动态调节冷却强度。AI驱动的能效管理系统正推动算力基础设施向“智能低碳”转型。

从技术到制度的系统性生态建构

强化标准化的约束与引导。《数据中心算力碳效可信评价技术规范》的发布,首次将“算力碳效”纳入评估体系,通过量化单位算力的碳排放量,为绿色算力提供可衡量的标尺。未来,需进一步完善碳排放双控政策,如明确要求智算中心绿电占比、通过“算力券”补贴激励企业使用低碳算力等。政策层面,需强化对高能耗算力设施的约束。各算力枢纽应该着力探索“绿电聚合供应”模式,强制要求新建数据中心与可再生能源协同布局,倒逼企业优化用能结构。要让这套政策组合拳为算力低能耗化提供制度保障。

打破技术壁垒畅通产学研全链路。开源社区的崛起为算法优化提供了新路径,如DeepSeek开放其模型蒸馏框架,使中小开发者能低成本构建轻量化模型。产业链协同整合高校、企业的研发资源,在算力产品层面形成“设计——验证——量产”全链条生态,在算力服务层面从“硬件依赖”转向“云端协同”。这种“产学研用”深度融合的模式,正成为算力低能耗化的加速器。

形成公众参与的良好氛围。要扭转“以能耗换性能”的发展趋势,必须更大力度地呼吁所有民众对算力能耗的关注,从而让节约算法能耗变得与节约用水、节约用电一样深入人心。通过公开透明的能耗数据报告,企业可以更加直观地感知算力碳足迹,从而优化算力能耗成本,政策制定者也能在成本效益和环境影响之间权衡利弊作出正确决策。

算力低能耗化不仅是技术问题,更是关乎数字文明存续的生态命题。随着先进制造、绿电协同、智能调度等技术的发展成熟,加快实现算力与能源、环境的深度耦合,构建起“技术——经济——生态”共赢的新范式,从而实现人工智能大模型的强大生成能力和算力低能耗“双赢”局面。

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/54283.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年5月5日 上午9:05
下一篇 2025年5月5日 上午9:10

相关推荐

  • DeepSeek们的成本,是怎么计算的?

    DeepSeek彻底让全球都坐不住了。 昨天,马斯克携“地球上最聪明的AI”——Gork 3在直播中亮相,自称其“推理能力超越目前所有已知模型”,在推理-测试时间得分上,也好于DeepSeek R1、OpenAI o1。不久前,国民级应用微信宣布接入DeepSeek R1,正在灰度测试中,这一王炸组合被外界认为AI搜索领域要变天。 如今,微软、英伟达、华为云…

    2025年2月19日
    13800
  • 爸妈凌晨4点趁孩子睡觉悄悄启程 离别泪目

    爸妈凌晨4点趁孩子睡觉悄悄启程!2月3日(发布),河南,凌晨4点爸妈趁孩子熟睡从河南老家启程到浙江打工。正要出发时,两个孩子从家里跑出,紧紧抱住妈妈。妈妈泪流满面:在问学校了,要把孩子接过来。 责任编辑:卢其龙 CN070

    2025年2月6日
    13700
  • 中央决定:李祝用履新任党委副书记

    中国人寿保险(集团)公司网站消息,2月14日上午,中央组织部有关干部局负责同志出席中国人寿保险(集团)公司干部会议,宣布李祝用同志任中国人寿保险(集团)公司党委副书记。 公开简历显示,李祝用出生于1972年10月,毕业于中国政法大学民商经济法学院,拥有研究生学历和法学博士学位,是高级经济师。他曾担任中国人民保险集团股份有限公司法律总监、法律合规部/风险管理部…

    2025年2月14日
    15900
  • 传罗永浩旗下细红线硬件团队全部裁撤!罗永浩发声:2025年春季招聘多个岗位,主要分为产品经理和工程师方向

    新浪科技讯 4月21日上午消息,有市场消息称,罗永浩旗下细红线科技在2024年放弃AR智能眼镜类产品研发,继而转向为AI智能硬件和AI大模型的研发。但2025年年初在AI智能硬件完成之后,整个硬件团队已被全部裁撤,只留下20多个软件工程师负责AI软件相关产品的研发和打磨,继续完成软硬件一体的产品在海外上市和销售。 值得注意的是,该消息传出后,罗永浩在社交平台…

    2025年4月21日
    10800
  • 2025跨境新生代②|从Agent到搜索引擎:阿里猛推“AI+外贸”能成为跨境电商新鲶鱼吗?

    阿里正持续推进AI(人工智能)在外贸行业的落地。 2月28日,阿里国际宣布旗下面向全球B2B(企业间的电子商务)买家的首个AI搜索引擎Accio接入DeepSeek等最先进的推理模型,正式上线深度研究、商业探索等功能。而此前,阿里国际站为中国外贸商家推出的AI工具“生意助手”也已全面接入推理模型。 在阿里的跨境电商业务中,一直以来,阿里国际站在AI落地上的动…

    2025年3月2日
    16200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信