当前位置:科学 > 正文

【全球新视野】谷歌展示全球首个多任务AI智能体 仅需100次训练便能完成任务

2023-06-26 22:59:08  来源:每日经济新闻

每经记者:蔡鼎 每经编辑:兰素英

机器人正迅速成为人们日常生活的一部分,但它们通常只用于特定任务。虽然人工智能领域的最新进展可以使机器人在许多方面发挥作用,但全球在通用机器人制造方面的进展仍然较慢,部分原因是收集真实世界的训练数据需要大量的时间。近日,谷歌旗下AI团队DeepMind的最新研究或可解决该领域面临的这一“痛点”。


(资料图)

美东时间6月20日,DeepMind展示了用于机器人的AI智能体RoboCat。DeepMind称其为全球首个能解决和适应多重任务的智能体。更重要的是,RoboCat是一个可以自我改进的AI代理,其可以操作不同的机械臂,而且只需最少100次演示即可解决任务,并从其自生成的数据中进行改进。

当地时间2023年6月14日,法国巴黎,2023年VivaTech科技创新展览会举行,一位参观者怀抱着一个机器人 视觉中国图

全球首个多任务AI智能体

谷歌旗下AI团队DeepMind的最新论文介绍了一种能够进行自我改进的AI代理,本质上是由AI赋能的软件程序,相当于机器人的“大脑”,由其加持的机器人与传统机器人不同之处在于,RoboCat更具“通用性”,并可实现自我改进、自我提升。

DeepMind在之前的研究中探索了如何开发支持大规模学习多任务的机器人,并将语言模型理解与辅助机器人的现实世界能力相结合。这个名为RoboCat的机器人智能体是全球首个能解决和适应多重任务的AI智能体,能够学习在不同的机械臂上执行各种任务,然后自我生成新的训练数据来对其进行改进。

RoboCat的学习速度比其他先进模型快得多——只需要通过100次左右的演示,RoboCat就可以学会操控机械臂来完成各式各样的任务,然后通过自生成的数据来进行迭代改进。这种能力将有助于加速机器人研究,因为这减少了对人类监督训练的需求,也是创造通用机器人的重要一步。

DeepMind的研究科学家、RoboCat团队的共同作者Alex Lee表示,“我们证明,一个大模型可以解决多个真实机器人承载的各种任务,并能迅速适应新的任务。”

据DeepMind,RoboCat基于其多模态模型Gato(西班牙语“猫”的意思),它可以在模拟和物理环境中处理语言、图像和动作。DeepMind将Gato的架构与一个大型训练数据集结合并起来,该数据集由各种机器人手臂的图像序列和动作组成,可以解决数百种任务。

在DeepMind演示视频中,RoboCat已经可以通过自主学习操控机械臂,完成“套圈”“搭积木”“抓水果”等任务。这些任务看似简单,但考验了机械臂操作的精准度、理解力以及对于形状匹配难题的解决能力。目前RoboCat完成一项新任务的成功率已经在初期36%的基础上提升了一倍。

基于原始数据集和新训练产生的数据,RoboCat的数据集将包含数百万次的训练轨迹数据。它学习的新任务越多,它就能更好地学习和解决额外的新任务。DeepMind的论文认为,执行任务成功率的大幅提升,是由于RoboCat的经验越来越丰富,就像人们在特定领域加深学习时发展出更多样化的技能一样。RoboCat独立学习技能和快速自我完善的能力,特别是当应用于不同机器人设备时,将有助于为未来的研究铺平道路。

将引领AI下一个浪潮?

《每日经济新闻》记者注意到,目前在机器人领域,包括特斯拉、谷歌、亚马逊、英伟达、腾讯等巨头已经有所布局。然而,正如DeepMind上述论文指出,由于训练机器人需要大量的时间,因此智能化水平仍不足,难以实现大规模的商业化。而RoboCat的问世或许能解决这一“痛点”。

其实,DeepMind的RoboCat只是AI赋能机器人的主要案例之一。今年以来,已经有数家公司将语言模型运用到了机器人上:2023年年初,谷歌推出视觉语言模型PaLM-E,并运用到工业机器人上;4月,阿里巴巴将千问大模型接入工业机器人;5月,特斯拉人形机器人Optimus展示了精准的控制、感知能力,同月,英伟达发布全新自主移动机器人平台。

得益于此,人工智能加持的机器人化身具身智能(Embodied Intelligence)吸引了全球的广泛关注。

马斯克在特斯拉2023年股东大会上便表示,人形机器人将是今后特斯拉主要的长期价值来源,“如果人形机器人和人的比例是2比1左右,那么人们对机器人的需求量可能是100亿乃至200亿个,远超电动车的数量”。英伟达创始人黄仁勋在ITF World 2023半导体大会上也表示,AI下一个浪潮将是“具身智能”。

东吴证券研报指出,具身智能首先需要听懂人类语言,分解任务、规划子任务,移动中识别物体,与环境交互,最终完成任务。东吴证券认为人形机器人很好地契合了具身智能的要求,有望成为标杆应用。“机器人研究的关键在于让机器人适应人类环境,最终走进千家万户的生活(工业、餐饮、医疗等多领域)。人形机器人有望率先在B端上量,最终打开C端市场。远期市场空间可观。”

东吴证券预计,2035年,假设人形机器人价格为20万元,且照顾、陪伴功能分别为美国/欧洲/亚洲市场累计新增了5%、7%、4%的渗透率,即单年渗透率分别为1%/1.4%/0.8%。在较悲观/中性/较乐观的场景中,家庭场景的市场规模将分别达到3.00万亿、3.66万亿、4.26万亿元。

每日经济新闻

关键词:

推荐阅读

域名抢注是是什么意思?投资角度来看什么域名好?

域名抢注是是什么意思域名抢注是通过抢先注册的方式获得互联网删除的域名的使用权。域名是由点分隔的一串数字,用于标记一台计算机或一组计 【详细】

捷达保养费用是多少?捷达是哪个国家的品牌?

捷达保养费用是多少?全新捷达的保修期为2年或6万公里,以先到者为准,新车可享受一次免费保养,首次免费保养在5000-7500km或1年内进行。如 【详细】

天然气泄露会造成爆炸吗?天然气泄漏怎么办?

天然气泄露会造成爆炸吗?家里用的天然气如果泄露是会发生爆炸的。当空气中含有混合天然气时,在与火源接触的一系列爆炸危险中,就会发生爆 【详细】

四部门明确App收集个人信息范围 个人信息保护范围判断标准

四部门明确App收集个人信息范围近日,国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合印发《常见类型移动互联网 【详细】

丰田致炫介绍 致炫威驰对比汇总

丰田致炫介绍参考价格: 6 88ー10 28W,基本参数: 1 3升 1 5升 5mt,5 3升 100公里。YARiS L致炫是YARiS L的替代传统车型,也是我们中国 【详细】

相关新闻

关于我们  |  联系方式  |  免责条款  |  招聘信息  |  广告服务  |  帮助中心

联系我们:85 572 98@qq.com备案号:粤ICP备18023326号-40

科技资讯网 版权所有