DeepSeek为何引发全球轰动 中国AI赶超美国

中国AI初创公司深度求索(DeepSeek)在短短一个月内发布了两款大模型:DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉,性能与OpenAI相当,引起了硅谷的关注,甚至引发了Meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。

DeepSeek为何引发全球轰动

Scale AI创始人Alexander Wang在接受采访时提到,DeepSeek在他们的测试中表现最好,与美国最好的模型相当。他还表示,DeepSeek-V3是中国科技界带给美国的一个苦涩教训,中国以更低的成本、更快的速度和更强的实力赶超了美国。

DeepSeek为何引发全球轰动 中国AI赶超美国

国外媒体也对中国AI的新进展给予了高度关注,认为这些进展为硅谷敲响了警钟。在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型,且未使用尖端芯片,这让人质疑巨额资本投入是否是最有效的方法。

DeepSeek为何引发全球轰动 中国AI赶超美国

一名Meta员工在匿名平台上透露,由于DeepSeek-V3的表现,Meta已经进入恐慌模式。DeepSeek-V3在基准测试中超越了Llama 4,而其训练预算仅为550万美元。Meta的工程师们正在争分夺秒地分析DeepSeek的技术,试图复制其成功。管理层则为GenAI研发部门的巨额投入感到焦虑,因为单个高管的薪资就超过了训练整个DeepSeek V3的成本。

DeepSeek为何引发全球轰动 中国AI赶超美国

去年12月27日,DeepSeek推出开源模型DeepSeek-V3,在聊天机器人竞技场排名第七,是全球前十中性价比最高的模型。不到一个月后,DeepSeek正式开源R1推理模型,允许所有人在遵循MIT License的情况下蒸馏R1训练其他模型。1月24日,DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性领域,DeepSeek-R1表现出色,排名第一。风格控制方面,DeepSeek-R1同样与o1并列第一。

DeepSeek为何引发全球轰动 中国AI赶超美国

著名投资公司A16z的创始人马克·安德森称赞Deepseek-R1是他见过最令人惊叹的突破之一,而且还是开源的。A16z合伙人Anjney Midha也表示,DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。

DeepSeek为何引发全球轰动 中国AI赶超美国

对于中国AI快速发展的原因,诺奖得主、“AI教父”杰弗里·辛顿认为中国的STEM教育比美国更好,拥有更多受过良好教育的人才,这为AI的发展提供了坚实的基础。尽管美国试图通过限制来减缓中国的发展,但这只会促使中国加速发展自己的技术。

DeepSeek为何引发全球轰动 中国AI赶超美国

斯坦福大学和Epoch AI的研究人员发表的研究表明,到2027年,最大型的模型训练成本将超过10亿美元。然而,DeepSeek的训练成本并不昂贵,Noah’s Arc资本管理公司认为DeepSeek-V3有可能彻底改变训练和推理领域的游戏规则。一些投资者对此表示担忧,认为这种低成本的突破可能会对行业带来重大影响,甚至挑战美股芯片股的股价。

DeepSeek为何引发全球轰动 中国AI赶超美国

外媒纷纷报道DeepSeek的新进展,认为其为硅谷敲响了警钟。Business Insider报道称,DeepSeek-R1的开源特性可能挑战那些试图通过出售技术赚取巨额利润的公司。CNBC邀请Perplexity CEO Aravind Srinivas分析了DeepSeek引发的担忧。英国《金融时报》也报道了DeepSeek如何震惊硅谷,并探讨了资源更丰富的美国AI公司能否捍卫其技术优势。加州大学伯克利分校AI政策研究员Ritwik Gupta指出,中国的系统工程师人才库比美国大得多,他们懂得如何充分利用计算资源来更便宜地训练和运行模型。

DeepSeek为何引发全球轰动 中国AI赶超美国

DeepSeek为何引发全球轰动 中国AI赶超美国

责任编辑:张佳鑫 0764

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/13624.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年1月27日 下午7:58
下一篇 2025年1月27日 下午7:58

相关推荐

  • 市场监管总局修订《采用国际标准管理办法》,稳步扩大标准制度型开放

      格隆汇4月21日|据市场监管总局,日前,市场监管总局修订出台《采用国际标准管理办法》,将于2025年6月1日起施行。修订的主要内容包括五个方面,一是明确所采用国际标准的范围和采标主体的范围;二是建立国际标准全过程跟踪机制;三是明确采标国家标准制定周期要求;四是强化版权政策要求;五是完善采用国际标准监督和纠错机制。下一步,市场监管总局将以《办法》出台为契机…

    2025年4月21日
    12700
  • 快递网点迎新一轮派费调整 生存空间再受挤压

    春节前后,不少快递公司再次悄悄下调了派费,虽然每次只降几分钱,但一线网点感受到了压力。以一家日派2万票的共配网点为例,如果每票派费降低5分钱,意味着每天少收入1000元,一个月少入3万元。在各项基础成本无法下降的情况下,网点只能无奈地给快递员下调派费。 为了保障快递员队伍稳定,各网点采取不同措施。华南一家网点从2月8日起,将每个业务员的日均签收量作为基数,超…

    2025年2月14日
    14500
  • 上海邀约全球高塔点亮“中国红” 共庆申遗成功首个春节

    1月28日农历除夕夜,上海的东方明珠广播电视塔和上海中心大厦率先点亮“中国红”,向全球高塔和高层建筑发出邀约,共庆申遗成功后的首个春节。从除夕到正月初七,浦江两岸闪耀着红色光芒。东方明珠通身披挂喜庆正红,照亮了上海的夜空;上海中心塔冠则展示了“灵蛇献瑞”、金蛇舞动的光影效果。陆家嘴高楼群实时联动,以建筑立面为媒介,描绘出“上海繁花”的璀璨光影。 除了上海之巅…

    2025年1月29日
    16200
  • 涉案金额逾31亿元!最高检披露李传良贪腐案进展

    涉案超31亿,最高检披露李传良案进展!李传良违法所得没收案涉案金额逾31亿元,系全国涉案金额最大的职务犯罪适用违法所得没收程序案件。2月12日,最高人民检察院检察委员会委员、职务犯罪检察厅厅长张晓津透露,在该案的办理中,检察机关坚持在中央追逃和跨境办的统一领导下,充分发挥检察一体优势,强化统筹协调和对下指导,有效推动案件办理进程。近年来,检察机关共起诉李传良…

    2025年2月12日
    14800
  • 上海男子当街求饶原因太可气 撞人逃逸被追截

    1月16日中午12点左右,在上海宝安公路与菊泉街路口,一名男子骑着电动自行车闯红灯,撞倒了一位正在过马路的老太太。老人当场昏迷不醒,而肇事者却骑车逃离现场。 这时,另一名骑着电动自行车的男子陈佳宇正好路过,他立刻追赶肇事者。陈佳宇是嘉定消防救援局指挥中心的接警调度员,当时正处在休假期间。公共视频显示,肇事男子在闯红灯后将老太太撞倒在地,并且没有停车反而加速逃…

    2025年1月20日
    13900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信