微软和Google都找到了自己的AI重心

这是《窄播Weekly》的第55期。本周我们关注的商业动态是:微软和Google都在开发者大会上进行了一次AI战略聚焦。

微软的Build 2025大会和Google的I/O开发者大会都选择了在本周举办,并且两场活动谈论的核心都是AI。

不同的是,微软的重心是向行业展示如何更好搭建Agent。微软在Build 2025大会上向用户呈现了一套更加成熟的Agent基础设施,想要吸引更多开发者加入到构建开放Agent网络(Open Agentic Web)的进程中——这是一个 AI 智能体能够在个人、组织、团队乃至整个端到端业务流程中协同运作的体系。

Google则致力于展示一个围绕Gemini搭建的AI操作系统雏形。谷歌首席执行官Sundar Pichai在演讲中使用了「Gemini时代(Gemini Era)」来描述未来。一方面,Google展示了更强的模型研发能力;另一方面,Google在将Gemini的能力融入到各个C端产品中。

微软和Google虽然重心不同,但其面向AI的战略规划都具备了一定的整体性,不再是进行散点的尝试,而是开始找到一条线,将散落的点串联起来,成为一个体系。这个体系的使命就如Pichai所言——让研究成果真正发挥作用,将其尽快转化为现实应用。

这是目前我们在国内大厂中尚未观察到的一种变化。我们能够观察到阿里、腾讯、字节都在模型基础层、业务AI化和产品创新方面进行着积极布局,但很难像总结本次微软和Google一样,为国内厂商提炼出一面指引整个企业向前推进的旗帜。苹果也是如此。

这可能是由于谨慎,也可能是还未下定决心。但无论出于何种考量,旗帜的出现都将是企业的AI战略推进到下一个阶段的标志之一。

微软:一切为了开放代理网络

一个展现出神奇效果,但还不够成熟的起步阶段——这是微软在Build 2025大会上对当下AI技术发展阶段的判断。微软CEO Satya Nadella选择用1991年的Win32、1996年的Web栈以及2008年的智能手机来类比当下AI所处的发展阶段。

以上这些节点,并不是一个C端用户大爆发的节点,而是B端用户面向未来布局的开始。

因此,微软将重心放在吸引更偏向B端的企业和开发者,并为其准备了一个拥有丰富工具和设备的操作间。

我们可以将各种让人眼花撩乱的工具和能力划分为以下几类:

第一类,提供开发环境的基础能力,包括Windows AI Foundry和Azure AI Foundry等。前者是微软为本地AI开发提供的开发环境,通过Foundry Local简化了在设备上直接运行AI模型、工具和智能体的过程。后者则是微软提供的云端开发平台,这次的一大更新是引进了xAI的Grok 3与Grok 3 mini。

同时,微软通过推出Azure AI Foundry Agent Service,让专业开发者能够编排多个专用Agent来处理复杂任务。微软AI Agent副总裁Ray Smith认为,试图将一个复杂的、要求高可靠性的流程完全整合到单一Agent中,往往会面临诸多挑战,将任务系统性地分解给多个Agent,则能显著增强可靠性。

第二类,提升Agent的开发效率。在微软的介绍中,已经有1500万开发者在使用GitHub Copilot功能,提升代码开发效率,这个规模已经占到GitHub总用户数的十分之一。在最新的更新中,GitHub Copilot将能够支持完成用户分配的BUG修复、代码维护等任务,并能在VS Code中使用。

微软还推出了Microsoft 365 Copilot Tuning,支持开发者使用针对公司数据、工作流程和风格微调的模型来构建更专属的Agent。开发者可以通过低代码的形式进行模型的微调,这个工作之前往往需要一整个数据科学团队耗费数周时间才能完成。

第三类,提供Agent的载体。微软在面向C端的Agent载体上并没有着墨太多,反而是重点介绍了对协作产品Teams的升级。Nadella认为,新的Teams真正将聊天、搜索、笔记、生成和Agent整合到一个直观的框架中。这也是一个完整的AI的用户界面,支持多人协作,并承载了Agent的流通。

第四类,提供网络连接能力。一方面微软开始全面支持MCP(Model Context Protocol)协议,这让它想建立的Agent网络具备了开放属性和复杂的任务执行能力。在现场演示中,应用开发者使用VS Code中的GitHub Copilot功能和Windows的MCP协议,依靠3句话就实现了特定风格网页的开发。

第一句话的指令下,GitHub Copilot连接WSL (Windows Subsystem for Linux)的MCP服务器,完成了最新版本的Fedora安装;第二句指令下,GitHub Copilot创建了一个网站项目;第三句指令下,GitHub Copilot利用MCP协议,从用户的Figma客户端中提取了相应的设计细节,并据此对网页进行了调整。

在MCP协议基础上,微软这次还提出了NLWeb概念。微软CTO Kevin Scott认为,MCP协议是AI时代的HTTP,而NLWeb则是AI时代的html,能够让任何拥有网站或API的人轻松地将其变成一个Agent。「每个NLWeb端点默认都是一个MCP服务器,这意味着那些人们通过NLWeb提供的东西将可以被任何支持MCP的Agent访问。」

微软已经围绕开放代理网络完成了对自身业务的基础梳理。在这次梳理之后,微软的产品体系将服务于AI时代的HTTP与html,借此来延续互联网时代的荣光。

Google:用Gemini改造和连接一切

不同于微软在Build 2025大会上呈现的服务企业和开发者的AI产品,Google在I/O大会上展示了让更多C端用户眼前一亮的创新。大模型能力的升级、搜索的AI化尝试、Android XR的实用化展示,都加深了Google想要让C端用户更有效使用AI的判断。

在模型层面,Google的模型能力进展快速,且具备了更丰富的能力。首先,Gemini 2.5 Pro的推出,扭转了市场对Google大模型业务的看法,使其成为大模型王冠的有力竞争者。其次,本次发布的视频模型Veo 3和生图模型Imagen 4,在展示效果上都获得了比较正面的评价。

模型基础上,Google发展出了不同的基础Agent能力。其中,Project Astra主打低延迟的多模态能力,可以通过摄像头和麦克风观察、理解周围的环境,且具备长期记忆能力。Project Mariner则强调多任务处理能力,一次能处理12项任务,能够代理用户浏览和使用网站,完成购买动作。

在I/O大会的现场演示中,这些基础Agent能力已经被应用在了AI搜索、Chrome浏览器、Gemini App、智能眼镜等C端产品的AI化改造中。

核心的搜索业务上,Google终于开始用AI加码。5月20日开始,Google会向所有美国用户推出AI 模式。用户可以向Gemini提出几百字的问题,也能在后续体验到多模态问答功能和Deep Research能力。Google也会在Chrome浏览器加入AI助手,帮助用户总结提炼页面信息。

目前,Gemini App的月活跃用户数超过4亿。Gemini Live将支持摄像头和屏幕共享,让AI帮助用户了解和记忆周围的环境。并且,Gemini的Agent模式还将能够帮助用户找房、预约、订票。现场演示中,Gemini Live可以指导用户学习如何修理自己的自行车,并帮助其打电话订购所需零件。

软件端之外,基础Agent也被应用在了硬件端。Android XR被Google视为Gemini时代走向大众的首个Android平台。在现场的演示中,我们看到了Gemini Live能力的硬件化。Google还计划未来几个月之内,把Gemini带到手表、汽车仪表盘,甚至电视上。

同样的,Google也升级了AI化的编程工具。一方面,名为Jules的编程Agent,可以像GitHub Copilot一样实现异步开发,可以自动重构代码、编写测试。另一方面,升级之后的Gemini Code Assist支持代码审核、长文件解析、多人协作,集成了个性化建议和团队代码规范工具。

从基础模型到软件,再到硬件和编程工具,Gemini无疑是凝聚这一切的核心。Google的策略很简单,就是要通过不断将Gemini的模型能力产品化,融入到现有的和未来场景中,来搭建起一个面向AI时代的系统雏形。

国内巨头还未找到真正突破口

尽管具体方向不同,但微软和Google共同验证了「AI走向应用」的大趋势。

只不过,微软是在创造条件,让人们能够更轻松地探索AI应用;Google则是要通过打造系统,让自己成为基础的AI应用。这是两个公司所具备的不同资源和禀赋决定的——微软以提供企业服务为主,Google面向的是C端市场。

如果以这两家公司为参照物来观察国内的大厂,会发现阿里、腾讯、字节三家虽然还没有拎出特别清晰的主线,但在做AI应用的大趋势下也是各有侧重。

阿里在AI时代的优势体现在大模型和云服务上,to B向开发者提供支持、构建开放Agent生态的路径比较顺畅。电商业务作为阿里在互联网时代的C端优势,很难顺畅转换为AI时代的to C应用支点。因此,夸克的重要性得到了提升。面向未来,阿里可能需要把Agent的发展势能注入夸克。

腾讯更接近Google,拥有相对稳固的C端产品体系和流量入口,会优先考虑如何完成面向C端的存量产品改造和面向未来的C端产品创新,就像最近对QQ浏览器进行的改造。但相比Google,腾讯的模型能力更弱,目前只能依靠DeepSeek和混元双模型驱动。腾讯虽然有增强自身大模型能力研发的动作,但还看不到腾讯版Gemini2.5出现的迹象。

字节也有C端流量,但短视频也同样难以直接转换为AI时代的C端入口。这也是为什么字节会重视豆包大模型的多模态能力,并在三家中最为积极地去探索AI硬件。To B业务上,字节相对欠缺生态基础,需要找到更有效的开放方式。并且,与阿里一样,字节也更需要一个开放的Agent生态。

到目前为止,这些侧重也没有催生出像微软和Google一样的战略重心,看似布局全面的三家,都还没找到自己的真正突破口。

*:not([class*=”icon”]):not([class*=”fa”]):not([class*=”logo”]):not([class*=”mi”]):not([class*=”code”]):not(i){font-family:PingFang SC,Arial,”Material Icons Extended”,stonefont,iknow-qb_share_icons,review-iconfont,mui-act-font,fontAwesome,tm-detail-font,office365icons,MWF-MDL2,global-iconfont,”Bowtie” !important;}[class*=”code”]{font-family: Consolas !important}

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/61168.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年5月27日 上午9:36
下一篇 2025年5月27日 上午9:37

相关推荐

  • 三星Galaxy S25系列搭载全新AI:引领智能新潮流

    1月23日,三星电子在Galaxy全球新品发布会上推出了Galaxy S25系列。该系列包括Galaxy S25 Ultra、Galaxy S25+和Galaxy S25。与此同时,三星也进一步展示了其在AI领域的创新成果,Galaxy S25系列搭载的Galaxy AI成为一大亮点。 三星Galaxy S25系列的AI能力极为突出。其搭载的三星Galaxy…

    2025年2月1日
    14400
  • 球星定制祝福视频,一门价值10亿美元的大生意

    如果你和你最好的朋友都是篮球迷,试想一下他生日当天,你在party上播放一条视频,里面是勒布朗·詹姆斯念着他的名字,饱含感情地送上生日祝福,会是怎样的场景? 你可能会觉得这不切实际。但如果我告诉你,只要花点钱(绝对在普通人承受范围内)就能实现这一切,你会不会心动? 有人就注意到了这门生意,并且短短几年就让公司市值达到了10亿美元。这篇文章,我们就来了解一下这…

    2025年2月28日
    13800
  • 上海车展观察:BBA回到C位了吗?

    在挤去了流量泡沫之后,4月的上海车展为世界汽车工业呈现了一席完美的科技盛宴,适逢40周年的上海国际车展见证了世界汽车产业初到中国,再到中国汽车工业从配角到主角实现完美转身的光辉岁月。 不知不觉间,上海车展已成为了世界汽车工业的”风向标“:这里不仅汇聚了1366台新车,163台首发新车,还有中外近1000家汽车产业链企业,他们占据了三分之一的展区,这是一场新技…

    2025年5月9日
    12500
  • 儿童书展亚博馆下周开锣,首设4大展区,激发儿童创意兼减压

    第八届“儿童书展 暨 超级亲子用品展”(儿童书展)将于5月23-25日假亚洲国际博览馆盛大举行!今届“儿童书展”加开至5个展览厅,总面积达28,400平方米,首设4大展区:“香港学校展区”、“大湾区BB展区”、“文化创意展区”及“创科教育展区”,融合阅读、教育及创科。小朋友5至6月考试压力大,在“儿童书展”开心畅玩,减轻课业压力,更可缓和亲子关系,一举两得!…

    2025年5月14日
    13400
  • 丁香医生,要IPO了

    又一个独角兽,准备冲刺IPO。 近日,数字医疗健康科技企业丁香园已启动赴港上市筹备工作,计划最快于2025年正式向港交所递交招股说明书。 线上医生赛道,正在走出“疫情脉冲”的阴影,迎来政策、技术与支付端的三重共振。医保个账线上支付开闸、AI大模型落地医院、专科复诊与慢病管理需求井喷,让“互联网+医疗”从流量故事转向价值深耕。 丁香园冲刺港股IPO,腾讯等资本…

    2025年9月8日
    11800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信