DeepSeek新模型火到海外 开源大模型正超越闭源

DeepSeek上周发布了开源模型DeepSeek-R1,并声称其性能可以与OpenAI的o1正式版相媲美,这一消息在海外AI业界引发了广泛讨论。焦点在于,当开源模型的能力达到甚至超越最新的闭源模型时,可能会改变整个大模型的竞争格局。

DeepSeek新模型火到海外 开源大模型正超越闭源

根据DeepSeek的介绍,DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等测试中的得分接近或超过o1正式版。该模型在后训练阶段大规模应用了强化学习技术,在仅有少量标注数据的情况下显著提升了推理能力。

Meta首席AI科学家Yann Lecun认为,DeepSeek-R1的发布意味着开源大模型正在超越闭源模型,而不是单纯地表明中国公司在AI领域超越美国公司。他表示,DeepSeek将从开放研究和开源中受益,类似于Meta的PyTorch和Llama。通过提出新想法并在他人工作的基础上进行实现,由于这些工作是公开和开源的,每个人都能从中获益,这就是开放研究和开源的力量。

责任编辑:张佳鑫 0764

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/13578.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年1月27日 下午6:58
下一篇 2025年1月27日 下午6:58

相关推荐

  • 世界,您好!

    欢迎使用WPCOM。这是您的第一篇文章。编辑或删除它,然后开始您的博客!

    2017年4月14日
    31202
  • 网传”L3级自动驾驶汽车首例判决”引关注 官方辟谣

    近日,一则“广州法院对一起小鹏汽车L3级自动驾驶追尾事故作出首例判决”的消息在网上广泛传播。自动驾驶、追尾事故,又是首例判决,多个信息放在一起,立即在网络上引起了网友的广泛关注及讨论。这则消息是真的吗?一起来追问真相。 近日,微博用户“CHE车说道”在多平台发布《L3级自动驾驶首例判决!车企担责70%,智驾法规全面重构》。文章称2024年12月,车主王某驾驶…

    2025年2月15日
    16500
  • 假期最后一天返程有多堵 铁路迎来客流高峰

    2月4日正月初七是春节假期最后一天,国铁集团郑州局迎来返程客流高峰,务工流、旅游流、返程流叠加,预计发送旅客80.1万人,计划开行旅客列车1743列。2月3日该局单日发送旅客79.1万人,创春运以来单日发送旅客新高。 从车票预售情况看,管内郑州东站、郑州车站、洛阳龙门站、商丘站等车站出发、中转、到达多股客流叠加。为有效应对返程高峰,国铁集团郑州局科学统筹运力…

    2025年2月4日
    13900
  • 春节多地住宅成交小幅增长 楼市现回暖迹象

    每周四,封面天天见之“封面会买房”都会带来最新楼市资讯与行业观察。从2月6日到2月12日,成都的楼市动态值得关注。 本周,成都暂无住宅用地出让。 在商品房成交方面,成都本周成交1768套,较上周上升约678.95%,成交总面积为237348.97平方米。二手房成交4687套,较上周上升约694.41%,成交总面积为442600.24平方米。 预售方面,大成都…

    2025年2月13日
    13900
  • 特朗普:预计很快就伊朗问题做出决定

      格隆汇4月14日|美国总统特朗普周日表示,他预计会很快就伊朗问题做出决定。上周六,美伊两国在阿曼举行了“积极”和“建设性”的会谈,并同意本周再次举行会谈。特朗普曾威胁说,如果不能就停止伊朗核项目达成协议,他将采取军事行动。他在空军一号上说,他会见了伊朗问题顾问,预计会迅速做出决定。他没有透露更多细节。Axios援引两名消息人士的话说,美国和伊朗之间的第二…

    2025年4月14日
    12500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信