实测DeepSeek深度思考模式 低成本高效挑战OpenAI

当硅谷仍在为GPU万卡集群投入巨额资金时,来自杭州的一群年轻人用557.6万美元证明,AI大模型的竞争并不只依赖规模,更看重使用效率。一款上架不到半个月的应用程序DeepSeek在1月27日登顶苹果应用商店排行榜,击败了ChatGPT。

实测DeepSeek深度思考模式

最近几天,AI领域最火的大语言模型不是ChatGPT或文心一言,而是杭州AI公司深度求索推出的DeepSeek。从去年12月26日发布的DeepSeek-V3到1月20日的DeepSeek-R1,这家公司以OpenAI三十分之一的价格实现了与o1模型相当甚至超越的成绩,给美国AI行业带来了不小的冲击。

实测DeepSeek深度思考模式 低成本高效挑战OpenAI

经过同题问答测试,DeepSeek-R1通过步步推理生成了具有逻辑性的回答,用户可以看到其思考过程。IT从业者刘鸿博表示,这种体验与第一次使用ChatGPT 3.5相似,甚至更加震撼。他认为DeepSeek对高语境内容和中文网络梗的理解能力更强,达到了脱口秀文本的水平。

实测DeepSeek深度思考模式 低成本高效挑战OpenAI

DeepSeek-R1发布后,不少美国AI从业者在社交平台上表达了内心的震撼。面对成本仅为“零头”但性能优秀的大模型,许多人发现传统的高投入模式已无法阻止用户的选择。北京时间1月27日,DeepSeek在美国、中国和英国的App Store免费应用下载榜上名列前茅。

实测DeepSeek深度思考模式 低成本高效挑战OpenAI

根据官方公布的性能测试,DeepSeek在数学测试、编程等多个领域与o1模型表现旗鼓相当,在某些测试中还超过了o1模型。此外,DeepSeek的训练成本更低,使用的算力也受到限制。相比之下,Meta旗下Llama3.1 405B模型的训练成本超过6000万美元,而OpenAI的GPT-4o模型的训练成本为1亿美元。

实测DeepSeek深度思考模式 低成本高效挑战OpenAI

DeepSeek的价格优势早在去年年中就已显现,但由于当时知名度不高,降价声势很快被其他大厂盖过。现在,除了价格优势外,DeepSeek还有比肩o1模型的性能。一些业内人士认为,DeepSeek可能颠覆硅谷巨头的高投入路径,对那些依赖销售大量GPU的公司形成挑战。

实测DeepSeek深度思考模式 低成本高效挑战OpenAI

在实际应用方面,DeepSeek的表现同样令人印象深刻。通过联网搜索功能,DeepSeek能够整理出详细的事件表,并展示清晰的思考过程。日常使用中,用户发现该模型对中国古代文化如生辰八字、奇门遁甲等非常熟悉,且展示了专业的思考过程。

DeepSeek之所以能以较低的成本训练出高性能模型,是因为它摒弃了传统的监督微调,采用单纯的强化学习训练。这一方法不仅减少了计算资源的需求,还观察到了模型的“顿悟时刻”。在处理复杂问题时,模型会重新评估初步方法并分配更多思考时间,显示出高级的问题解决策略。

DeepSeek团队由清华大学和北京大学的应届生和实习生主导,平均年龄不足26岁。这种自下而上的创新文化与OpenAI早期类似。面壁智能首席科学家刘知远认为,DeepSeek的成功证明了通过有限资源的高效利用可以实现以少胜多,缩小了中美在AI领域的差距。未来发展路径尚不明确,仍需百倍努力探出新路。

责任编辑:张佳鑫 0764

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/13789.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年1月27日 下午11:25
下一篇 2025年1月27日 下午11:26

相关推荐

  • 印度大壶节踩踏已有近百人死伤 悲剧引发全国哀悼

    印度北方邦普拉亚格拉杰市大壶节一活动现场29日凌晨发生踩踏事件。据当地媒体报道,踩踏事件发生在当地时间29日2时30分左右。前往印度教圣河恒河和亚穆纳河交汇处沐浴的人群在活动结束后离开现场时发生推搡,随后引发踩踏。由于人数众多,当地政府和现场管理人员难以及时管控。伤者已被送往附近医院治疗。 据路透社报道,事故发生后,已有近40具遗体被带到医院太平间,但政府尚…

    2025年1月30日
    16300
  • 联合国秘书长发言人谴责美国接管加沙言论 反对强迫流离失所

    在联合国的一次例行发布会上,联合国秘书长发言人对美国总统特朗普提出的“接管加沙地带”并重新安置巴勒斯坦人的计划表达了明确反对,指出任何强迫流离失所的行为无异于种族清洗。 巴勒斯坦伊斯兰抵抗运动(哈马斯)高级官员祖赫里发表声明,称特朗普的言论不可接受,认为这会制造地区混乱和紧张局势。巴勒斯坦解放组织执行委员会秘书长谢赫强调,巴方拒绝将巴勒斯坦人赶出家园,并坚持…

    2025年2月7日
    12700
  • 河南省纪委监委通报:2人被查 涉及卫生系统官员

    河南省红十字会组织宣传部副部长高碧波涉嫌严重违纪违法,目前正接受河南省纪委监委驻省卫生健康委纪检监察组纪律审查和三门峡市监察委员会监察调查。周口市卫生健康委员会原二级巡视员刘炯也因涉嫌严重违纪违法,正在接受周口市纪委监委的纪律审查和监察调查。 责任编辑:张蕾

    2025年1月25日
    13500
  • 工信部:上半年我国集成电路设计收入2022亿元,同比增长18.8%

      格隆汇8月1日丨工信部发布数据,上半年,软件产品收入15441亿元,同比增长10.6%,占全行业收入比重为21.9%。其中,基础软件产品收入903亿元,同比增长13.8%;工业软件产品收入1445亿元,同比增长8.8%。上半年,信息技术服务收入48362亿元,同比增长12.9%,占全行业收入的68.5%。其中,云计算、大数据服务共实现收入7434亿元,同…

    2025年8月1日
    12700
  • 寒武纪涨超6%升破1300元,再创新高,市值超5500亿!高盛:将寒武纪目标价上调50%至1835元最乐观可达3934元

      格隆汇8月25日|寒武纪-U(688256.SH)高开6.26%,报1321元,再创历史新高,市值达5526亿元。   消息面上,工信部表示,有序引导算力设施建设,切实提升算力资源供给质量。加快突破GPU芯片等关键核心技术,扩大基础共性技术供给。   另外,高盛8月24日将寒武纪目标价上调50%至1835元,并称最乐观情境下可达3934元。

    2025年8月25日
    12400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信