Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

最近,来自中国杭州的初创公司深度求索(DeepSeek)发布了两款大语言模型,在全球科技界引起广泛关注。这两款模型性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却大大降低。

Nature连发三篇文章聚焦DeepSeek

2025年1月20日,DeepSeek发布了部分开源的“推理”模型DeepSeek-R1,该模型能够解决一些科学问题,水平接近OpenAI于2024年底发布的GPT-o1。几天后的1月28日,DeepSeek又推出了Janus-Pro-7B,这是一款根据文本提示生成图像的模型,其性能与OpenAI的DALL-E 3以及Stability AI的Stable Diffusion相当。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

国际顶尖学术期刊Nature在其官网连续发布了三篇关于DeepSeek的文章。1月29日的文章提到,科学家们纷纷涌入DeepSeek,从AI专家到数学家再到认知神经学家,他们对DeepSeek-R1的高性能和低成本感到惊叹。次日的文章则强调,DeepSeek-R1执行推理任务的水平与OpenAI的GPT o1相当,并且向研究人员开源,相比之下,OpenAI推出的GPT o1及最新成果o3基本上都是黑匣子。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

DeepSeek-R1的成本也令人印象深刻。尽管DeepSeek尚未公布训练DeepSeek-R1的全部成本,但据估计,其算力租赁费用约为600万美元,而Meta公司训练Llama 3.1 405B的算力是其11倍,训练成本超过6000万美元。此外,使用DeepSeek-R1界面的用户只需支付运行ChatGPT o1费用的不到三十分之一。DeepSeek还创建了DeepSeek-R1的迷你“蒸馏”版本,以便算力有限的研究人员也能使用该模型。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

另一篇文章分析了中国如何创造出震惊世界的AI模型DeepSeek,指出政策支持、大量资金以及众多AI专业人才帮助中国企业建立了先进的大语言模型。国内研究人员表示,这家初创企业的成功在意料之中,符合政府成为全球人工智能领导者的雄心。中国科学院计算技术研究所副所长陈云霁研究员指出,鉴于中国在开发大语言模型上的巨额投资和大量博士人才,像DeepSeek这样的公司在中国出现是不可避免的。

事实上,阿里巴巴也在1月29日发布了迄今为止最先进的大语言模型Qwen2.5-Max,称其性能优于GPT-4o、DeepSeek-V3以及Llama-3.1-405B。上周,月之暗面联合字节跳动发布了新的推理模型Kimi 1.5和Kimi 1.5 1.5-pro,在某些基准测试中的表现优于GPT-o1。

责任编辑:张蕾

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/16657.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年2月1日 下午2:58
下一篇 2025年2月1日 下午2:58

相关推荐

  • 大V解读以日印三国领导人排队进白宫 特朗普外交策略初现端倪

    特朗普再次就任美国总统后,谁会成为首批访问白宫的外国领导人引起了广泛关注。2月3日,白宫官员宣布,印度总理莫迪将于下周访问白宫,成为继以色列总理内塔尼亚胡和日本首相石破茂之后,第三位受邀访问白宫的外国领导人。 内塔尼亚胡是第一位被接见的领导人。特朗普与内塔尼亚胡在上一个任期中关系密切,美国对以色列的支持也显而易见。特朗普曾承认耶路撒冷为以色列首都、将美国驻以…

    2025年2月6日
    12300
  • 华为盘古大模型被指抄袭后发声:承认参考业界开源,但非增物训练

    凤凰网科技讯(作者/于雷)7月7日,针对近期开源社区及网络平台上关于华为盘古大模型开源代码的广泛讨论与质疑,盘古Pro MoE技术开发团队正式发布官方声明,对此事做出回应。 声明首先明确指出,盘古Pro MoE开源模型是基于华为自家的昇腾(Ascend)硬件平台开发、训练的基础大模型,并非基于其他厂商模型进行增量训练的产物。华为方面强调,该模型在架构设计和技…

    2025年7月6日
    13800
  • 东阿阿胶:近5年四换董事长 股权激励部分业绩考核或“开倒车”

    《金证研》北方资本中心 含章*DL&*BR/作者 廉贞 映蔚/风控 在2025年3月17日发布的《2024年社会责任报告》中,东阿阿胶(000423)股份有限公司(以下简称“东阿阿胶”)称,充分调动其管理团队以及业务骨干的主动性和创造性等,探索高管及核心骨干、研发人员等中长期激励的建设,修订限制性股票激励计划。 而关于该次股权激励,可追溯到2024年…

    2025年3月22日
    19500
  • 拉文加盟国王 福克斯加盟马刺 三方交易达成

    北京时间2月3日,国王、马刺和公牛达成了一项三方交易。福克斯将加盟马刺,拉文则会前往国王。 在这次交易中,马刺获得了福克斯和麦克劳林。国王得到了拉文、西索科以及三个首轮选秀权(2025年黄蜂队、2027年马刺队、2031年森林狼队)和三个次轮选秀权(2025年公牛队、2028年掘金队、2028年国王队)。公牛方面则引进了扎克-科林斯、特雷-琼斯和许尔特,并从…

    2025年2月3日
    19700
  • 近10年来最大规模!巨头宣布大裁员,7000人面临失业 雅诗兰黛财报爆雷

    美国美妆巨头雅诗兰黛近日公布的财报显示业绩不佳,为实现降本增效,该集团宣布将再次裁员7000人。这是雅诗兰黛近10年来最大规模的裁员计划。 2月4日晚间,雅诗兰黛集团公布了2025财年第二季度(2024年9月30日至12月31日)的业绩报告。报告期内,雅诗兰黛集团净销售额为40.04亿美元(约合人民币290.34亿元),下滑6%;净利润亏损5.8亿美元(约合…

    2025年2月10日
    15000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信