DeepSeek深夜发布多模态大模型 超越DALL-E 3

中国公司DeepSeek在华尔街周一评估“DeepSeek风暴”时,发布了其最新产品:名为Janus-Pro的多模态大模型。该模型在图像生成基准测试中超越了OpenAI的DALL-E 3,并且是开源的。

DeepSeek深夜发布多模态大模型

除夕凌晨钟声敲响前不久,DeepSeek工程师们在“抱抱脸”平台上传了Janus Pro 7B和1.5B两个模型,这是对去年10月发布的Janus模型的升级。这两个模型具有15亿和70亿参数量,可以在消费级电脑上本地运行。与之前的版本一样,Janus Pro采用MIT许可证,在商用方面没有限制。

DeepSeek深夜发布多模态大模型 超越DALL-E 3

据DeepSeek介绍,Janus-Pro是一个新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码分离为“理解”和“生成”两条路径,同时仍采用单一的Transformer架构进行处理,解决了以往方法的局限性。这种分离不仅缓解了视觉编码器在理解和生成中的角色冲突,还提升了框架的灵活性。

DeepSeek深夜发布多模态大模型 超越DALL-E 3

从报告给出的数据来看,在部分文生图基准测试中,Janus-Pro 70亿参数模型的表现优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion 3-Medium等模型。尽管DALL-E 3是OpenAI在2023年发布的一款老模型,而Janus Pro目前只能分析和生成规格较小的图像(384 x 384),但其在如此紧凑的模型尺寸中依然展现了令人印象深刻的性能。

DeepSeek深夜发布多模态大模型 超越DALL-E 3

技术报告显示,在视觉生成方面,Janus-Pro通过添加7200万张高质量合成图像,使得在统一预训练阶段真实数据与合成数据的比例达到1:1,实现了更具视觉吸引力和稳定性的图像输出。在多模态理解的训练数据方面,新模型参考了DeepSeek VL2并增加了大约9000万个样本。

DeepSeek深夜发布多模态大模型 超越DALL-E 3

作为一个多模态模型,Janus-Pro不仅可以“文生图”,还能对图片进行描述,识别地标景点(例如杭州的西湖),识别图像中的文字,并能对图片中的知识(例如“猫和老鼠”蛋糕)进行介绍。公司在报告中展示了更多图像生成的案例。

责任编辑:于浩淙 zx0176

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/14026.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年1月28日 上午10:25
下一篇 2025年1月28日 上午10:25

相关推荐

  • 曼联球迷搞事情,踢阿森纳要游行示威,英力士的运营被球迷质疑?球迷不满情绪高涨

    曼联有许多球迷团队,其中1958球迷团队是最为忠诚和激进的。他们以慕尼黑空难年份命名,表达了对俱乐部历史的怀念和自己的忠诚。最近,1958球迷团队发布了一份公告,引起了媒体的广泛关注。 在英力士亏损、曼联裁员的消息背景下,这份公告显得尤为突出。一些球迷将英力士称为比格雷泽更糟糕的老板。第二次裁员、门票价格上涨至66英镑,使得英力士逐渐失去了球迷的支持。那么,…

    2025年2月15日
    19000
  • 央视春晚节目单官宣 巳巳如意迎新春

    中央广播电视总台《2025年春节联欢晚会》节目单已正式发布。晚会以“巳巳如意,生生不息”为主题,通过歌曲、舞蹈、相声、小品、戏曲、武术、魔术等多种形式的节目,为全球观众带来欢乐吉祥、喜气洋洋的新春氛围。 关于主持阵容,北京主会场由任鲁豫、撒贝宁、尼格买提、龙洋和马凡舒担任;重庆分会场则由张韬与何苗苗主持;湖北武汉分会场是杨帆和陈超;西藏拉萨分会场由朱迅和斯塔…

    2025年1月29日
    12900
  • 00后用家用打印机造250多万假币,把造假技术当成 “生财之道”,传授给他人牟利

    你可能想不到,家里常用的打印机,竟成了 00 后团伙伪造假币的 “作案工具”。日前,北京警方在工作中捕捉到一条异常线索 —— 一笔涉及假币母版图片的交易,顺着这条蛛丝马迹追查下去,最终成功捣毁 8 个货币伪造窝点,缴获假币 250 余万元,15 名犯罪嫌疑人全部落网,令人震惊的是,这些嫌疑人全是 00 后,其中还有未成年人,他们没有正式职业,靠着制假为生,部…

    2025年10月28日
    16700
  • A股午评:三大指数均涨超1%,沪指重上3400点,创业板指涨1.94%,北证50涨3.17%,无人驾驶概念爆发!超4600股上涨,成交额9251亿放量2413亿

      格隆汇6月24日|A股主要指数早盘集体上涨,截至午盘,沪指涨1%报3415.45点,深成指涨1.45%,创业板指涨1.94%,北证50指数涨3.17%。全市场半日成交额9251亿元,较上日放量2413亿元,超4600只个股上涨。   盘面上,无人驾驶概念爆发,海马汽车、浙江世宝(002703)、世运电路(603920)等十余股涨停,特斯拉上周末在美国得州…

    2025年6月24日
    12400
  • 雷军:可提前小定小米SU7 Ultra,发布后优先排产

    凤凰网科技讯 2月23日,小米董事长雷军今日发文称:喜欢Ultra的朋友,可以先下载小米汽车app提前小定,发布后将会优先排产。 小米SU7 Ultra是一款高性能纯电跑车,预计于2025年2月底上市,预售价格为81.49万元。该车型基于小米SU7重新设计,定位高端市场。 雷军曾表示,小米SU7 Ultra定价基于130亿元的研发投入及高端化战略,目标全年销…

    2025年2月23日
    15700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信