媒体揭秘国产大模型DeepSeek 硅谷震撼变革

中国国产大模型Deepseek在硅谷引起了轰动。从斯坦福到麻省理工,Deepseek R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。AMD宣布已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能,并针对AI推理进行了优化。

媒体揭秘国产大模型DeepSeek

一名Meta员工发文称,由于DeepSeek的低成本高性能,他们公司的人工智能部门陷入恐慌。自中国深度求索公司发布DeepSeek-V3模型以来,在双方的性能测试中,Meta重金打造的Llama 4模型从未胜出。在美国匿名职场论坛TeamBlind上,也有Meta员工表示:“Meta生成式人工智能部门陷入恐慌。”

媒体揭秘国产大模型DeepSeek 硅谷震撼变革

美国《商业内幕》网站报道称,Deepseek这家创新实力超群的中国人工智能初创企业发布了新的人工智能模型DeepSeek-R1,完全可以媲美OpenAI的GPT-3模型,其推理能力令美国科研人员感到震惊。CNBC上线了一篇长达40分钟的视频纪录片,报道了Deepseek的情况,认为这个事情颠覆了他们对AI的常识。报道指出,Deepseek完全由幻方资助,没有外部融资,而且是开源所有模型,在多项测试中超过了OpenAI的同类模型,使用的是低功耗的H800芯片,通过蒸馏大法仅花费了500万美元,远低于Meta公司AI部门任何一位高管的年薪。

媒体揭秘国产大模型DeepSeek 硅谷震撼变革

关于人工智能发展的三大因素——算法、算力和数据,中国在算力方面一直落后,主要是因为美国限制台积电为华为代工人工智能芯片,并限制中国购买最新的英伟达显卡。美国国内的AI认知认为算力是AI的核心,发展AI就是要不断堆算力堆GPU。然而,DeepSeek-R1是在美国政府不断加大对中国人工智能领域“卡脖子”力度的背景下诞生的,它通过创新的工程设计与高效的训练方法,在有限的运算能力中实现了高性能,纯靠强化学习就达到了与GPT-3相当的水平。其训练成本极低,只用了1024张英伟达H800显卡,花费只有560万美元,而OpenAI的ChatGPT-GPT-3使用了至少一万张更为先进的英伟达H100显卡,成本大约为1亿美元。

媒体揭秘国产大模型DeepSeek 硅谷震撼变革

有媒体形容,这可能是大语言模型的典范转移,今后的AI发展重点在于不依赖庞大的运算资源下创造高质量产品。Deepseek的成功证明,中国这家初创公司以极少的算力、极低的成本便能达到美国企业纯粹靠堆算力才能达到的效果。这对英伟达及其CPO技术是绝对利空。在中国禁先进AI算力卡的背景下,中国可以采用英伟达20%左右的国产算力卡来与美国竞争。这意味着,使用中国AI芯片的中国大模型完全可以不逊色于美国顶尖大模型,而且成本更低,降低了中小企业与开发者的进入门槛,增加了选择性。

媒体揭秘国产大模型DeepSeek 硅谷震撼变革

硅谷巨头们也可能会加入中国的玩法与游戏规则,否则根本无法抗衡。这对行业的影响是,他们不再需要大量堆GPU,硬件方面的确定性变得不确定。高性能AI芯片的红利期可能要过去了。英伟达面临巨大挑战,或许黄仁勋也没有想到,有一天会遭遇跨界打击的命运。

责任编辑:张佳鑫 0764

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/13374.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年1月27日 下午3:59
下一篇 2025年1月27日 下午3:59

相关推荐

  • 百余名师生家长现场吊唁黄旭华院士 国之脊梁,成长灯塔

    百余名师生家长现场吊唁黄旭华院士。2月7日,一股强冷空气席卷广东。黄旭华院士6日在湖北武汉逝世的消息传回家乡,让潮汕大地平添了几分寒意。家乡的亲友们怀着沉痛的心情缅怀这位伟大科学家的功勋,追忆他与潮汕故土的深厚情缘。 黄旭华,曾用名黄绍强,1926年3月12日出生于广东省汕尾市(原海丰县),祖籍揭阳市,曾在汕头市聿怀中学求学。作为大国赤子,黄旭华为国铸重器却…

    2025年2月8日
    14300
  • 墨西哥总统:反对将移民视作罪犯 维护人权与主权

    墨西哥总统辛鲍姆1月31日在首都墨西哥城的新闻发布会上表示,墨方反对将移民视作罪犯来对待。当被问及美国计划在古巴关塔那摩的美国海军基地扩建已有非法移民收容中心时,辛鲍姆强调,墨西哥将坚持维护国际法并保护人权,始终把尊重本国公民的人权和维护国家主权放在首位。他指出,墨美双方可以在这一框架下就移民议题保持合作交流。 此前,美国总统特朗普于1月29日宣布,他将责成…

    2025年2月1日
    13600
  • 马龙在意大利街头继续整活 米兰追星狂潮再现

    马龙在意大利街头继续整活。36岁的中国乒乓奥运冠军马龙最近成为了网友们热议的话题,因为他亮相意大利米兰,引发了一股追星热潮。球迷们非常热情,不断高呼“龙队我爱你”,展现了马龙的广泛影响力。 马龙此次前往意大利是为了参加米兰时装周。许多在米兰的球迷得知消息后,纷纷来到他下榻的酒店等候,希望能够亲眼见到这位奥运冠军。当马龙出现在街道上时,球迷们纷纷拿起手机拍照留…

    2025年1月20日
    12400
  • 广西一老师被举报侵犯学生 警方立案 涉事教师已被调查

    2月15日,多名网友爆料称,广西大学附属中学南宁校区一名高中老师被举报强迫学生与其发生关系,并电话威胁学生。当地警方已接到报案并立案处理。 据网友发布的帖文显示,一名自称是该校高三学生的女生自述,从高二开始,她被物理老师郑某某诱骗并被迫发生关系。她一直内心非常矛盾,直到看到近期百色老师侵犯学生的事件后,才决定说出来。 另有网友公开的录音中,一名男子威胁一名女…

    2025年2月15日
    13400
  • A股早评:三大指数高开,贵金属、稀土永磁高开!盛达资源、湖南白银涨5%,中金黄金涨超4%,卧龙新能、京运通涨停

      格隆汇7月14日|A股三大指数小幅高开,沪指涨0.09%报3513.25点,深证成指涨0.09%,创业板指涨0.02%。盘面上,贵金属板块高开,盛达资源、湖南白银涨超5%,中金黄金(600489)涨超4%,现货白银站上38美元/盎司,创逾13年来新高;稀土永磁概念继续活跃,卧龙新能、京运通(601908)涨停,此前两大稀土巨头宣布提价;券商股普涨,国联民…

    2025年7月14日
    13500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信