Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

最近,来自中国杭州的初创公司深度求索(DeepSeek)发布了两款大语言模型,在全球科技界引起广泛关注。这两款模型性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却大大降低。

Nature连发三篇文章聚焦DeepSeek

2025年1月20日,DeepSeek发布了部分开源的“推理”模型DeepSeek-R1,该模型能够解决一些科学问题,水平接近OpenAI于2024年底发布的GPT-o1。几天后的1月28日,DeepSeek又推出了Janus-Pro-7B,这是一款根据文本提示生成图像的模型,其性能与OpenAI的DALL-E 3以及Stability AI的Stable Diffusion相当。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

国际顶尖学术期刊Nature在其官网连续发布了三篇关于DeepSeek的文章。1月29日的文章提到,科学家们纷纷涌入DeepSeek,从AI专家到数学家再到认知神经学家,他们对DeepSeek-R1的高性能和低成本感到惊叹。次日的文章则强调,DeepSeek-R1执行推理任务的水平与OpenAI的GPT o1相当,并且向研究人员开源,相比之下,OpenAI推出的GPT o1及最新成果o3基本上都是黑匣子。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

DeepSeek-R1的成本也令人印象深刻。尽管DeepSeek尚未公布训练DeepSeek-R1的全部成本,但据估计,其算力租赁费用约为600万美元,而Meta公司训练Llama 3.1 405B的算力是其11倍,训练成本超过6000万美元。此外,使用DeepSeek-R1界面的用户只需支付运行ChatGPT o1费用的不到三十分之一。DeepSeek还创建了DeepSeek-R1的迷你“蒸馏”版本,以便算力有限的研究人员也能使用该模型。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

另一篇文章分析了中国如何创造出震惊世界的AI模型DeepSeek,指出政策支持、大量资金以及众多AI专业人才帮助中国企业建立了先进的大语言模型。国内研究人员表示,这家初创企业的成功在意料之中,符合政府成为全球人工智能领导者的雄心。中国科学院计算技术研究所副所长陈云霁研究员指出,鉴于中国在开发大语言模型上的巨额投资和大量博士人才,像DeepSeek这样的公司在中国出现是不可避免的。

事实上,阿里巴巴也在1月29日发布了迄今为止最先进的大语言模型Qwen2.5-Max,称其性能优于GPT-4o、DeepSeek-V3以及Llama-3.1-405B。上周,月之暗面联合字节跳动发布了新的推理模型Kimi 1.5和Kimi 1.5 1.5-pro,在某些基准测试中的表现优于GPT-o1。

责任编辑:张蕾

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/16657.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年2月1日 下午2:58
下一篇 2025年2月1日 下午2:58

相关推荐

  • 朱亚文戴戒指的手 力破离婚谣言

    朱亚文戴戒指的手。1月21日,朱亚文在个人社交账号上晒出了一张左手握拳的照片,照片中他的左手无名指戴着婚戒,以此回应了网传的离婚谣言。 此前有博主发布沈佳妮的照片并配文称其为“朱亚文前妻”,并表示如果言论不实愿意承担相应的后果和法律责任。对此,搜狐娱乐向朱亚文所在经纪公司求证,工作人员明确回应称两人并未离婚,相关传言纯属虚构。 责任编辑:卢其龙 CN070

    2025年1月23日
    15800
  • 阿门·汤普森拿下21分7篮板4助 火箭惜败灰熊止四连胜

    北京时间1月31日上午十点半,西部第三灰熊客场对阵西部第二火箭。两队此前三次交手火箭全胜,加之双方在西部排名上竞争激烈,这次对决备受关注。火箭最近状态极佳,双杀了联盟第一骑士,绝杀卫冕冠军凯尔特人,还击败了老鹰。杰伦格林在对阵灰熊时表现尤为出色,场均可以贡献30.3分、2.3次抢断和4.3个三分球,三分命中率高达59.1%。因此,灰熊能否限制住杰伦格林成为比…

    2025年1月31日
    21300
  • 时政微视频丨瞰辽宁

    辽宁 陆地面积14.87万平方公里 海域面积15万平方公里 常住人口4182万人 2024年地区生产总值32612.7亿元 同比增长5.1% 投资增速创十年新高 稳住工业大盘 持续锻造“大国重器” 规上高技术制造业增加值增长11.3% 深化重点实验室群与产业集群“双群互动” 不断夯实科技创新“底座” 山海关外其兴可待 持续优化营商环境 全力支持民营企业发展壮…

    2025年1月22日
    14100
  • 古诗里的星空:“西北望射天狼”在天文学上成立吗? 矫正被扭曲的箭矢

    西北望射天狼”在天文学上成立吗?华夏传统星官体系起源于上古时期,在宋元时期达到高峰,一直到明末都传承得非常好。近现代的许多天文研究却使我们偏离了本该传承的轨道。 古诗词“西北望,射天狼”所指的天象在近现代天文学里被扭曲了。今天我们就来追根溯源,矫正这一现象。 二十八星宿中的井宿含有两个星官:狼星和弧矢。《步天歌》中描述道:“丘下一狼光蓬茸,左畔九个弯弧弓,一…

    2025年2月12日
    16600
  • 港股早评:三大指数低开,科技股、汽车股普跌,泡泡玛特再创新高!老铺黄金涨2%,阿里跌2.28%,小米跌超1%

      格隆汇6月12日|特朗普单边关税言论及美国CPI令美元承压,隔夜美股三大指数高开低走集体收跌,热门中概股涨跌不一。港股三大指数集体低开,恒指跌0.59%,国指跌0.78%,恒生科技指数跌1.13%。盘面上,大型科技股普遍下跌,阿里巴巴跌2.28%,美团、京东跌近2%,小米跌超1%,百度跌0.92%;汽车股全线下跌,新能源车“蔚小理”跌幅居前,创新药概念股…

    2025年6月12日
    14000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信