张钹院士:具身智能推动实现通用人工智能

 

具身智能强调认知受智能体的感知与动作的影响,主张智能或智能行为来自智能体身体与周围环境的交互,而不仅仅是大脑的功能。这种思想与建立在笛卡尔身心二元论基础上的离身智能不同,后者没有考虑大脑与身体之间的联系。具身智能理论对认知科学、心理学、人类学、艺术等都产生了深刻的影响,由此诞生了具身认知、具身心理学等分支学科。当前,具身智能理论深入大众关注的人工智能、机器人技术等领域,并产生重大影响。

从传统离身智能发展到现代具身智能

早期人工智能研究者认为,机器可以通过对符号的操作实现对人类思考(理性行为)的模拟,即让机器像人类那样思考,无需考虑身体和环境。他们把人工智能定义为模拟人类的智能行为,除了模拟思考之外,还包括感知、动作,以及情感与灵感等。由于他们认为思考和身体、环境是分离的,因此在模拟这些行为时,是各自独立进行,没有考虑行为之间的相互联系。人工智能的另一学派内在主义,主张人工智能应该模拟人类大脑的工作原理,我们通常称之为类脑计算。这个学派也没有考虑思考、感知与身体的关系。因此传统人工智能中的两大学派都属于离身智能。

具身智能则认为人类的智能行为不仅依赖大脑的思考,还需要通过与物理环境的交互来进行学习和决策,最后通过感知将执行的结果反馈到大脑,形成闭环,构成一个智能体,这样才能真正实现模拟人类智能行为的目标。具身智能这种思想的提出,与传统人工智能不同,将推动人工智能向更高的水平——通用人工智能发展。

人工智能发展史经历3个阶段

人工智能的发展历史,经历过三个阶段。第一代人工智能提出以知识与经验为基础的推理模型,通过这一模型来模拟人类的思考。这一模型具有可解释性与可理解性的优点,但由于知识表示与获取的困难,该模型在应用和产业化上受到很大限制。第二代人工智能提出数据驱动的模型,通过基于大数据的机器学习,实现对人类感性和情感行为的模拟。由于模型的图像、语音等输入数据来自客观世界,因此具有很大的应用潜力,但由于模型本身存在不安全、不可靠、不可信(不可解释)、不可控和不易推广等缺陷,因此应用范围有限。虽然科学家在这期间也进行过模拟人类动作,比如手的操作与脚的步行等研究,但没有将这些研究与思考、感知等其他方面联系起来。总之,这两代人工智能都有很大的局限性,而且只针对特定领域、利用特定模型去解决特定任务。

2020年大语言模型的出现,把人工智能推向新的发展阶段——第三代人工智能。大语言模型具有强大的语言生成能力,使机器能够在开放领域下实现与人类的自由交互,这表明机器已经完全掌握了人类的语言。此事意义重大。正如哲学家维特根斯坦所言:“我的语言界限,就是我的世界界限。”机器一旦掌握了人类的语言,也就在某种程度上理解了人类的世界。大语言模型向通用人工智能迈出了关键一步。

为向通用人工智能迈进创造条件

尽管人工智能在语言生成上取得成功,在许多其他任务上还不能实现领域的通用性。比如医疗诊断,目前我们还没有开发出适用于各种疾病的计算机医疗诊断系统。另外,大语言模型只会说(生成语言),不会干(行动)。还有大量的任务,特别是复杂的任务,人工智能目前还无法完成。我们离真正的通用人工智能仍有一定距离,其原因就在于,传统人工智能对人类(大脑)的思考、感知与动作等方面的模拟是相互分开的,而且与环境隔离。

具身智能则强调物理身体、环境感知与反馈的重要性,并通过它们实现与外部世界的交互。这正好弥补了传统人工智能的不足,使机器通过与环境的反复交互,逐渐学习适应环境并优化其决策和行动,不断迭代,完成更多、更复杂的任务,这就是新的学习范式——强化学习。由此可见,具身智能将使人工智能在更广泛的环境下,完成更多的任务,向通用人工智能迈进。

机器人领域首次提出具身智能思想

机器人的研究远在人工智能诞生之前。1954年,科学家发明数字控制可编程的机械臂,为现代工业机器人打下基础,也预示着现代机器人的真正诞生。在人工智能的发展过程中,虽然也将模仿人类动作纳入研究范围,但由于当时研究的重点是思考与感知,动作(身体)并没有受到很大关注。后来,机器人研究慢慢形成一个新领域——机器人学,与人工智能中的动作研究同时存在。机器人学研究的范围更宽,也更多关注技术、实际应用和产业化。

1986年,移动机器人的先驱罗德尼·布鲁克斯提出了行为主义机器人学的主张,他认为传统的符号主义人工智能过于依赖复杂的推理系统,忽视了身体与环境的互动对智能行为的关键性贡献。可以说,这是在机器人领域首次提出具身智能思想。

推动机器人领域技术取得进步

具身智能思想推动机器人技术从单一感知(如视觉或触觉)向多模态感知发展。自动驾驶汽车需要在各种气候条件和复杂环境下行驶,全天候的环境感知极为重要。目前,除了利用单一的摄像机之外,人们更多地考虑多传感器融合,即除摄像机之外,还要综合利用激光扫描仪、雷达、声呐、卫星定位等不同传感器,以保证感知的可靠性。同样,对机械手来讲,也需要利用触觉、力觉、力矩觉等多传感器的融合,以便在复杂环境下实现复杂操作,比如,装配、抢险救灾、排雷等。具身智能思想推动机器人技术更加关注软件与硬件的高度整合。为了适应不同工作任务的需求,我们需要设计不同类型的机器人,如为家庭服务的人形机器人,拥有灵巧双手的装配机器人,拥有特殊功效的仿生机器人等。不同类型的机器人需要不同的控制技术,也会导致不同的学习和感知方式,这反过来又影响机器人形态的设计。这些都属于机器人软硬件协同的问题。

具身智能中的智能体概念对机器人技术将产生重要影响。根据智能体这一概念,机器人将思考、感知和动作连为一体,既可以在数字世界中也可以在物理世界中完成任务,利用数字世界又可以对物理世界进行仿真,这些对推动机器人的发展意义重大。比如,无人车的实验如果在物理世界中进行,就要受到气候条件、突发事件等诸多因素限制,利用仿真模拟则会大大提高效率,节省时间与费用。利用智能体理论,我们可以让机器人相互之间进行博弈,实现机器的自我进化(迭代),使机器人的性能不断提高。

(作者张钹为中国科学院院士、清华大学教授,获国家自然科学三等奖、国家科技进步三等奖等奖项;曾任智能技术与系统国家重点实验室主任、国家“863”高技术计划智能机器人主题专家组专家)

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/65324.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年6月9日 下午4:06
下一篇 2025年6月9日 下午4:08

相关推荐

  • 股权被冻结,史玉柱又被送上风口浪尖

    近日,据中国执行信息公开网信息显示,巨人投资有限公司(以下简称“巨人投资”)、紫晶置业投资管理有限公司(下称“紫晶置业”)新增一则被执行人信息,执行标的金额达4.9亿余元,执行法院为北京金融法院,立案日期为2025年5月6日。 其中,巨人投资为知名企业家史玉柱麾下的核心投资平台;而紫晶置业股权穿透之后为自然人刘世昆和刘鉴庸各持股50%的公司,而这是一家和泰山…

    2025年5月16日
    15900
  • 员工主动窃取涉密文件投靠间谍换钱 国家安全机关迅速侦破

    国家安全机关近期侦破了一起重要涉密人员主动投靠境外间谍情报机关的重大间谍案件,及时制止了卖密行为,维护了国家安全。 韩某某在某重要涉密单位工作,他沉迷于网络上一些博主发布的“炫富”视频,追求纸醉金迷的生活方式,金钱观和价值观逐渐扭曲。为了满足个人贪婪欲望,他萌发了利用工作便利窃取并出卖单位涉密文件资料换取金钱的念头。 韩某某借调到单位核心涉密部门工作时,多次…

    2025年2月7日
    12500
  • 风水轮流转!玉米上涨“势如破竹” 抢粮情绪高涨

    风水轮流转!玉米上涨“势如破竹” 抢粮情绪高涨。春节过后,华北地区的深加工行情呈现出涨-平稳-涨-平稳-涨的模式。基层粮点和贸易商则经历了收-不卖-收-不卖-抢-不卖的过程。农户尤其是种地大户则是观望-卖-观望-卖-卖-卖。这种情况下,一旦价格下跌,供应量就会减少,导致价格上涨。随着价格持续上涨,市场情绪被进一步激发,一些地区毛粮收购价甚至达到了1.06~1…

    2025年2月17日
    11700
  • 华为悍将能让掉队的荣耀逆风翻盘吗 赵明离职内幕揭示挑战

    荣耀CEO赵明离职的消息在公司宣布完成股改并准备启动IPO流程不到一个月时开始流传。尽管荣耀多次否认,但最终还是得到了确认。1月17日,荣耀官方宣布赵明因身体原因辞去CEO等职务。赵明在内部论坛上发表了一篇长文,表示自己执掌荣耀十年,现在终于放手,感觉压力山大。 五年前,华为将荣耀整体剥离,深圳国资联合三十多家企业接手,荣耀成为深圳国资旗下的企业。据接近荣耀…

    2025年1月19日
    16800
  • 京籍无房户入学须登记备案是什么情况?备案政策到底要满足啥条件?

    “老杨,我北京户口,没买房租在海淀,孩子明年幼升小,社区说必须先登记备案,这到底是要干啥?不备案就不让上学了?” 这周后台收到不下20条类似提问,看来京籍无房户入学登记备案这事儿,戳中了不少家长的焦虑点。有人觉得是“政策收紧卡入学”,也有人猜是“租购同权要落地”,今天咱用3个真实案例+底层逻辑,给小白们把这事儿扒明白——这不是“拦路虎”,而是北京教育资源分配…

    2025年11月22日
    3800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信