DeepSeek开源周收官,颠覆存储架构!OpenAI继续“大力出奇迹”,GPT-4.5 价格达R1的270倍

谁能想到DeepSeek为了搞大模型自己弄了套文件系统?

2月28日,DeepSeek开源周的最后一天,DeepSeek直接公开了V3和R1训练推理过程中用到的Fire-Flyer文件系统(简称3FS,第三个F代表File)和基于3FS和DuckDB构建的轻量级数据处理框架Smallpond。

图片来源:X

3FS是一个真正意义上面向现代SSD(固态硬盘)和RDMA(远程直接访问)网络的文件系统,它可以把固态硬盘的带宽性能利用到极致,并表现出了惊人的速度:180节点集群中的聚合读取吞吐量为6.6TiB/s;25节点集群中GraySort基准测试的吞吐量为3.66TiB/分钟;每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。

KCORES联合创始人karminski-牙医评价道:“DeepSeek颠覆了存储架构。”

图片来源:X

根据DeepSeek团队介绍,3FS就是为了AI训练和推理工作负载的挑战所开发的。它利用现代SSD和RDMA网络来提供共享存储层,从而简化分布式应用程序的开发。

它可以在没有双方操作系统介入的情况下,将数据直接从一台计算机的内存传输到另一台计算机,也不需要中央处理器、CPU缓存或上下文交换参与。特点就是高通量、低延迟,尤其适合在大规模并行计算机集群中使用。

那这样方便的系统,有什么作用呢?每经小编请DeepSeek大模型用白话来解答这一问题。

而在DeepSeek开源3FS文件系统前几个小时,OpenAI推出了期待已久的GPT-4.5,之前这个模型的代号为“Orion”。OpenAI声称这是其迄今最大、知识最丰富的模型,现已向每月订阅费用达200美元的ChatGPT Pro用户开放。

OpenAI首席执行官阿尔特曼表示,新模型的运行成本太高了,下周OpenAI将增加数万块GPU,提供算力支撑。

在马斯克旗下xAI的Grok 3发布时,大家都兴奋地表示,Scaling Law(规模法则)还没有撞墙。但GPT-4.5一出,外界发现,OpenAI“撞墙”了。

GPT-4.5的预训练计算量是GPT-4的10倍,但是基准测试只比4o好5%。在AIME和GPQA等困难的学术基准测试中,GPT-4.5的表现也达不到o3-mini、DeepSeek-R1和Claude 3.7 Sonnet等领先AI推理模型的水平。

图片来源:X

阿尔特曼都只能解释道,虽然它又贵,又慢,又不够好。但是它有人情味儿。

有博主测评后表示,GPT-4.5这情商高得直接把智商干没了。

图片来源:数字生命卡兹克

而GPT-4.5的价格也是高到离谱,每百万Tokens输出价格150美元(约合人民币1093.5元),是其他模型的10~100倍,更别说和DeepSeek比了。

2月26日,DeepSeek宣布了错峰价格制度,DeepSeek-R1在高峰期每百万Tokens输出价格为2.19美元(约合人民币15.9元),低谷期的价格仅为0.55美元 (约合人民币4元)。以低谷期的价格计算,GPT-4.5的价格是DeepSeek-R1的近270倍。

图片来源:X

DeepSeek为何能做出成本高效的AI模型呢?从这周开源的五大项目就能看出来,DeepSeek主打的就是“榨干”硬件性能。

第一天:FlashMLA架构,直接“爆改”英伟达GPU,突破H800计算上限;

第二天:DeepEP,第一个用于MoE(混合专家)模型训练和推理的开源EP(专家并行)通信库,提供高吞吐量和低延迟的all-to-all GPU内核;

第三天:DeepGEMM,仅300行代码的通用矩阵乘法库;

第四天:连开三源,创新的双向流水线并行算法DualPipe、用于MoE的负载均衡算法EPLB,以及训练和推理框架的性能分析数据;

第五天:3FS和Smallpond,高效的分布式文件系统和以之为基础的数据处理框架压榨固态硬盘性能。

在DeepSeek的数弹连发后,有网友称,DeepSeek成领头羊了。

图片来源:X

那让我们来看看,DeepSeek是怎么评价GPT-4.5这一模型的吧。

所以说,与其用OpenAI的天价模型,真不如使用DeepSeek更高效的R1模型。但老是“服务器繁忙,请稍后再试”,怎么办?

不用担心,2月12日每日经济新闻App和每经网全面接入DeepSeek、Kimi、豆包、智谱清言、文心一言和通义千问6款大模型。用户通过每日经济新闻App和每经网就能与大模型自由对话还能一键“问公司”“问投资”“问基金”。

不得不说,用起来真的很丝滑,目前使用量已经超15万次了!

咋用呢?超简单!

下载每日经济新闻App

https://www.nbd.com.cn/corp/2016app/index.html

再往下看

一、 在每日经济新闻App首页,点击“DeepSeek”图标或首页轮播图“自由问+问公司问投资问基金免费使用DeepSeek、Kimi、豆包等六款大模型”。

二、 进入“每经大模型平台”页面,即可使用DeepSeek、Kimi、豆包、智谱清言、文心一言和通义千问6款大模型中任意一款。

最近,每经“136计划”还增加了新功能:

大模型解读投资热榜。

只需点击投资热榜中的任意新闻。

立即就能得到大模型的全面分析。

还能一键生成图片分享给朋友

告别“服务器繁忙”

快用每日经济新闻App吧!

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/35588.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年3月1日 下午2:59
下一篇 2025年3月1日 下午3:00

相关推荐

  • 百度港股大涨超10% 文心一言免费开放助推

    百度港股大涨超10%。港股市场百度集团-W(9888.HK)股价涨幅一度超过10%,达到98.15港元,创下去年10月以来的新高。 文心一言宣布自4月1日起全面免费开放,PC端和APP端用户均可体验其最新模型。此外,文心一言上线了深度搜索功能,并于4月1日起免费开放使用。该功能具备强大的思考规划和使用外部工具能力,可为用户提供专家级内容回复,并支持多场景任务…

    2025年2月13日
    11200
  • 港股华虹半导体盘中大跌超10%报46.06港元;A股华虹公司停牌!为解决同业竞争筹划购买华力微控股权

      格隆汇8月18日|华虹半导体(1347.HK)盘中大跌超10%报46.06港元;A股华虹公司停牌。   华虹公司(688347.SH)公告称,为解决IPO承诺的同业竞争事项,公司正在筹划以发行股份及支付现金的方式购买上海华力微电子有限公司控股权,同时配套募集资金。本次收购标的资产为上海华力微电子有限公司所运营的与华虹公司在65/55nm和40nm存在同业…

    2025年8月18日
    9900
  • 楼上爆改5个卫生间致渗水 业主多方投诉未解决

    苏州读者陈先生反映,他家楼上的租户将138平方米的房子改成了5个独立带厕所的房间。二房东为了每个房间都带厕所,把阳台改成了厨房,厨房增设了厕所,还在客厅铺管道加盖了厕所。陈先生发现阳台天花板有渗水后,找到正在装修的1901室,看到房子被改造成了五个带厕所的房间。他在1901室拍到的视频显示,入口玄关处增设了5个分水表,厨房区域增设了隔墙和卫生间,在客厅砌了一…

    2025年1月25日
    16200
  • 小米回应SU7断轴事件 非产品质量问题

    近日,有车主称其驾驶小米SU7驶过坑洼路段后,车辆出现了断轴情况。小米汽车方面对此进行了回应,表示完全不存在所谓“断轴”情况。 2月9日,小米汽车通过官方微博发布消息称,该事故发生在2025年1月30日10点56分,涉事车辆在淮安盱眙一乡村公路上以约70km/h的车速行驶(该路段限速20km/h)。因不当驾驶行为,车辆右后侧轮胎、轮毂、悬架等部位在冲击破损路…

    2025年2月10日
    16500
  • 港股早评:三大指数低开,科技股、汽车股普跌,重型机械股走高,阿里网易跌2%,小米跌超1%,小鹏汽车跌5.4%

      格隆汇3月19日|隔夜美股纳指、标普500指数均跌逾1%,中概指数小幅下跌0.18%。港股三大指数低开,恒指跌0.17%,国指跌0.4%,恒生科技指数跌1.01%。盘面上,昨日强势的大型科技股集体走低,百度跌3%,阿里巴巴、网易跌超2%,小米跌超1%,京东、快手、美团皆有跌幅,腾讯小幅飘红;汽车股、DeepSeek概念股等热门板块齐跌,小鹏汽车跌5.4%…

    2025年3月19日
    19600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信