24小时联系电话:185 8888 888

头条
您现在的位置: 首页 > 头条 > Facebook的AI使用模式教机器人在不到10个小时的训练中即可操纵对象
  • 和悟资本:认真学习、深入领会全国两会精神

    和悟资本:认真学习、深入领会全国两会精神

    发布时间:2020/06/05

    6月5日,上海和悟投资管理有限公司在上海召开专题会议,学习2020全国两会的会议精神。上海和悟投资管理有限公司董事长兼首席执行官、中融德汇(北京)基金管理有限公司董事长兼首席执行官、香港宜达保险经纪有限...

  • 兼顾财富与健康看直播免费抽取莱克立式吸尘器

    兼顾财富与健康看直播免费抽取莱克立式吸尘器

    发布时间:2020/04/02

    疫情全球蔓延,市场动荡,如何做好个人和家庭的财富管理,利用资产配置策略实现个人财富保值增值,莱克电气联手诺亚财富,与您在疫情全球蔓延的当下,看清麻烦,也抬头找寻头上的阳光。 行情简讯 新冠疫情在全球...

  • 长城汽车:2019年营收962亿元 海外营收涨超60%

    长城汽车:2019年营收962亿元 海外营收涨超60%

    发布时间:2020/04/02

    3月31日晚,长城汽车发布的2019年年度业绩公告显示,公司2019年营业总收入962.11亿元,较去年同期下降3.04%,归属于母公司股东净利润44.97亿元,同比下降13.64%。其中,出海业绩表现突出,2019年公司在海外市场营...

  • 格力被授权对弈机器人专利,想打败下一个李世石?

    格力被授权对弈机器人专利,想打败下一个李世石?

    发布时间:2020/04/02

    根据天眼查的消息,近日,格力电器全资持股的珠海格力智能装备有限公司新增多项专利信息,且诸多专利都与机器人相关,其中包括一项名为“对弈难度等级的处理方法及装置、机器人”的专利。 提起对弈机器人,大家首先...

  • 给你一只牛股,让你七月敢梦敢想满载而归

    给你一只牛股,让你七月敢梦敢想满载而归

    发布时间:2020/07/07

    多年来,每每提到散户,听到的都是一片唏嘘!什么散户注定被割韭菜,注定在股市里亏的一塌糊涂的言论就蹿了上来……. 但今天我想讲心中有敌,天下皆为敌。心中无敌,无敌于天下。我们一起面对未知的恐...

  • 自2009年以来石油期货首次突破10美元大关

    自2009年以来石油期货首次突破10美元大关

    发布时间:2020/03/31

      冠状病毒或Covid-19大流行对全球石油市场造成了空前的破坏,使石油期货对后来的合约形成了创纪录的两位数折扣,全球代理基准布伦特原油价格近期暴跌首当其冲。 周五(3月27日),5月北海布伦特原油期货价格...

  • COVID-19公开反对石油和天然气的“压裂”

    COVID-19公开反对石油和天然气的“压裂”

    发布时间:2020/03/31

      COVID-19的袭击将有一天过去,我们将恢复正常生活。我们的现实是,我们必须尽力而为。 11月将举行选举,所以让我们开始吧。 问题:为什么这么多总统候选人(仍然有两个)提出的能源政策是:(1)对美国国家安...

  • 2020太和顾问人力资本调研启动会,如期举办,圆满落幕!

    2020太和顾问人力资本调研启动会,如期举办,圆满落幕!

    发布时间:2020/03/23

    疫情黑天鹅扰乱了公众的计划节奏,给社会和经济发展带来了突入其来的扰动和考验。在当下远虑与近忧共存的特殊时期,太和顾问特邀8位人力资源专家线上发布最新数据和趋势,指导企业调整战略,提升核心竞争力,渡过...

Facebook的AI使用模式教机器人在不到10个小时的训练中即可操纵对象

发布时间:2019/10/09 头条 浏览次数:163

 
双臂机器人如何完成打开瓶子的任务?总是需要用一只手抓住瓶子的底部,同时用另一只手抓住瓶盖并拧开。这种高级步骤序列就是所谓的架构,值得庆幸的是,它不受对象的几何和空间状态的影响。另外,与旨在通过学习策略来解决任务的强化学习技术不同,架构不需要在数小时,数周甚至数月的时间内提取数百万个示例。
最近,Facebook AI Research的一个团队试图使两个Sawyer机械臂具有从库中选择适当步骤以完成目标的能力。在每个时间步长上,他们的代理人都必须决定要使用的技能以及要使用的论据(例如,施加力的位置,力的大小或要移动的目标姿势)。尽管涉及复杂性,该团队表示,他们的方法提高了学习效率,因此仅需几个小时的培训就可以发现操纵技能。
团队的主要见解是,对于许多任务,学习过程可以分为两个部分:(1)学习任务模式和(2)学习为不同技能选择适当参数化的策略。他们断言,这种方法可以加快学习速度,部分原因是可以使用来自给定任务不同版本的数据来提高共享技能。而且,他们说这允许在相关任务之间转移学习到的模式。
Facebook AI研究机器人
“例如,假设我们已经学会了一种很好的方案,可以在仿真中使用长条,可以访问对象的姿势,几何信息等,以及更多内容,”该论文的共同作者详细解释了该工作。 “然后,我们可以将该模式重新用于相关任务,例如仅从原始摄像机观察结果中拾取现实世界中的托盘,即使状态空间和最佳参数化(例如,抓握姿势)都存在显着差异。由于该模式是固定的,因此针对该任务栏提取任务的策略学习将非常有效,因为它仅需要学习每种技能的(与观察相关的)论点。”
研究人员为上述两个机械臂提供了一个通用的技能库,例如扭转,提升和伸展,他们必须将其应用于涉及不同对象,几何形状和初始姿势的多个横向提升,拾取,打开和旋转任务。在MuJoCo(模拟环境)中,通过使用低维输入数据(例如几何和本体感受特征(关节位置,关节速度,末端执行器姿势))进行训练,学习了这些模式,然后在模拟以及在真实世界。
在实验过程中,Sawyer手臂(配备摄像头,并由Facebook的PyRobot开源机器人平台控制)的任务是操纵9个家用物品(例如rolling面杖,足球,玻璃罐和T型扳手),需要两个要与之配合的下颌抓爪。尽管必须从原始视觉图像中学习,但他们说系统在大约4到10个小时的培训中学会了使用2,000种技能来操纵大多数项目,并且成功率超过90%。
共同作者写道:“我们已经研究了如何利用与状态无关的技能序列来大大提高无模型强化学习的样本效率。” “此外,我们已经通过实验表明,将在模拟中学习的技能序列转移到现实世界中的任务,使我们能够非常有效地解决图像中的稀疏奖励问题,从而使训练真正的机器人执行诸如双手操作之类的复杂技能变得可行。”

姓 名:
邮箱
留 言: