阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

火星科技1月28日消息,今天,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。

其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,超越GPT-4o与Claude3.5。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

官方介绍称,新的Qwen2.5-VL能更准确地解析图像内容,突破性地支持超1小时的视频理解,可以在视频中搜索具体事件,并对视频的不同时间段进行要点总结,从而快速、高效地帮助用户提取视频中蕴藏的关键信息。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

而且无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents),实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。

Qwen2.5-VL 不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局。

此外,Qwen2.5-VL将OCR识别能力提升至一个新的水平,增强了多场景、多语言和多方向的文本识别和文本定位能力。同时,在信息抽取能力上进行大幅度增强,以满足日益增长的资质审核、金融商务等数字化、智能化需求。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

【本文结束】如需转载请务必注明出处:火星科技

责任编辑:随心

文章内容举报

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/14419.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年1月28日 下午3:51
下一篇 2025年1月28日 下午3:58

相关推荐

  • 又一国产机器狗“云深处山猫”秀肌肉:腾空飞跃、金鸡独立!

    火星科技1月23日消息,继宇树科技之后,又一家中国企业云深处科技秀出了最新的机器狗视频,这台名为“山猫”的机器狗首次展现了各种灵巧的技能。 从官方视频看,山猫采用了四轮足设计,可原地跳跃,能跨过深沟,还能在雪中前向翻滚360度并稳稳落地,展现了非常高的机动性和稳定性。 这还没完,除了四轮着地,山猫还能仅利用两条腿,甚至是单腿实现站立,并且不同调整姿态保持平衡…

    2025年1月23日
    20300
  • 1400万粉网红相亲整活翻车,Tim的 “冤” 与 “错” 藏在哪?

    著名头部视频自媒体账号“影视飓风”11月12日发布了一个视频,然后被骂上了热搜。 在这期视频中,“影视飓风”创始人Tim(潘天鸿)举着自己的简历在公园相亲角接受群众审视,被质疑是为了节目效果,故意愚弄大爷大妈。 先看一下这份简历: 给不熟悉他的读者解释下这份简历的含金量。 比如“国内学历初中”,因为Tim在英国读的高中和大学;比如家庭状况,“父亲职业快递相关…

    2025年11月16日
    12300
  • 第一次负责从0到1的产品时要注意哪几点?

    第一次负责从0到1的产品肯定是万分的紧张、激动,在这时千万不可大意,我根据我的经验写了些需要注意的地方。

    2017年4月25日
    1.1K06
  • 14 亿 5 个月亏超 7 亿!李书福押注极星遇滑铁卢,到底栽在哪?

    理想终究还是撞上了现实的墙。 早在今年 6 月,吉利老板李书福向极星汽车“输血”超 14 亿人民币。结果谁曾想,极星美股在上市后一路跳水,浮亏超过 50%。这可不是一笔小数目,简直就是拿真金白银为试错买单。短短五个月时间,直接被砍一半。因此,不少人觉着李书福这波被坑惨了,吉利的全球化梦更是破碎。 图源:微博 为啥极星汽车这么“脆”? 其实早有征兆。当初吹得有…

    2025年11月18日
    3500
  • 支付宝c类基金手续费?

    随着社会经济不断发展,越来越多的人开始注重理财和投资。其中,基金成为了众多投资者的选择之一,而支付宝的C类基金也受到了不少人的关注。但是,人们在购买支付宝C类基金时,会被收取一定的手续费,那么支付宝C类基金手续费是否值得付呢? 首先,我们来看看支付宝C类基金的手续费。目前,支付宝C类基金的手续费标准是:购买费用为0.1%,赎回费用为0.5%,管理费用也在其中…

    2025年8月29日
    24300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信