站内检索

如何实现机器人灵巧操作的主动感知与技能学习?
作者:尹力 发表时间:2019年12月02日

 

 

  作为国内顶尖学府之一,清华大学是我国最早开展智能机器人研究的单位之一。早在1985年该校就成立了智能机器人实验室,1990年智能技术与系统国家重点实验室又在此成立。

 

  2019年5月,清华大学人工智能研究院智能机器人研究中心宣告成立。该中心旨在推进跨学科基础理论研究,密切结合人工智能、认知科学、生物材料、仿生学等领域的最新进展,与人工智能研究院其他中心通力合作,在机器人主动感知、认知学习、柔性操控等方向开展前瞻性、基础性的理论与技术创新研究。

  近日,智能机器人研究中心主任、清华大学教授孙富春在“2019世界机器人大会”上表示,要让机器人完成灵巧的操作需要完成感知、目标特性识别、规划机构、技能的表达和学习等,“做人工智能一定要做有用的人工智能,机器人一定要落地”。

  《高科技与产业化》:请问研究机器人灵巧操作的主动感知与技能学习的意义与挑战何在?

  孙富春:马克思曾说过,劳动创造了人,劳动最主要的成本就是人类这双勤劳的手,所以手的操作是智能的直接体现,也是能力进化的一个主要的驱动力。

  人工智能在上世纪六十年代至八十年代期间受到关注,在八十年代到九十年代开始蓬勃发展。经过一段时间的低谷后,如今人工智能又开始兴起,面向人工智能的智能操作已经成为现在机器人发展当中非常重要的部分。

  婴儿从生下来就开始发育,伴随着生理、心理的成熟很快就可以灵巧地搭积木,让我们叹为观止。但要让一个机器人能够“像人”,哪怕像小孩那样搭积木都是具有挑战性的问题。

  人们希望厨房机器人能给我们把活儿全包了,同时也希望机器人能够进行艺术表演。比如我带领的团队正在做机器人弹钢琴的研究,丰田也在研发机器人弹钢琴、拉小提琴。

  然而目前大部分机器人产品都没有这种灵巧的操作系统,主要仍是外观和手势的展示,即便有一些相关的操作也是非常简单的。要让机器人完成灵巧的操作需要完成感知、目标特性识别、规划机构、技能的表达和学习,这也是一系列烦琐的工作和挑战。

  《高科技与产业化》:请您谈谈机器人视觉和触觉研发,并介绍您与团队的一些研发进展。

  孙富春:会弹钢琴的人经常被人夸奖,说他们弹琴的手感特别好。我们要如何才能获得这种手感?首先,要有皮肤感知的触觉,并且能在大脑当中形成感觉,这样才能形成触感。

  那么,机器人要如何才能形成触觉呢?这就需要研究机器人的传感器,包括触觉传感器,目前我们团队研制的指间传感器已经达到每平米241个触间,可以检测高达700赫兹的振动。两个事件的检测间隔已经达到30~50毫秒,检测精度达到40谬米。

  基于视觉的传感是目前主流研究方向,我们团队研究的指间传感器用到了弹性体表面的浮作材料。这个材料非常重要,上面有很多标志点而下面就是相机,摄像机会把标志点的移动记录下来,标志点的移动再通过人工智能的算法就可以得到表面的颜色、纹理、增压力、温度等非常丰富的信息。

  再介绍一下我们团队所研究的两款触觉传感器,包括可以感知接触物体表面的纹理信息。我们共做了43种布料可以展示传感器的触觉纹理信息和视觉,它们之间是完全不一样的,触觉更多的是展示深度信息和结构信息。

  世界机器人大会上都有关于灵巧操作的比赛,我们获得了2016年灵巧操作比赛的世界冠军。我们还队做了一个人工假肢,可以感知到12种行为,并且参加了2018年世界制造大会。

  现在有一个更重要的问题是,视觉和触觉要怎么融合?比如有两个矿泉水瓶子,一个是空的、一个装满水。从视觉表现来看非常接近,但是触觉完全不同,通过触觉的显著性很容易判别。又比如两个相同材料做的玩具,视觉上看完全不同,触觉却相当接近,我们通过视觉的显著性也很容易判别。

  机器人要如何利用视觉和触觉,实现对目标以及物体材料特性的识别?目前可以通过组吸收的办法可以进行融合。我们还要研究视觉的发育机理,机器人经常用到视觉、听觉和触觉等关联部分,如何做到这些关联部分的联合学习?这些都是非常重要的研究方向。

  《高科技与产业化》:目前机器人感知领域的研究有哪些特点和进展?

  孙富春:在多模态的感知方面,我们一直在研究,机器人究竟能不能像人一样做到对环境的感知和理解?比如有两张图,一张画的是花,另一张画的是老虎,但机器根本不认识什么是花、什么是老虎,只知道花的底层特征是什么,老虎的底层是什么。机器人会学习底层特征和语义的关联,但难以告诉人们这是画里的老虎还是真的老虎。老虎未来的行为是什么也无从谈起,因此必须通过认知解决这样类似的问题。

  乌鸦是公认最聪明的动物之一,我们都听过乌鸦喝水的故事。乌鸦衔石子放在瓶里最终喝到水的这一行为,其中的感知过程是什么呢?其实就是从感知到行为,行为又帮助它继续感知,感知越精确,行为也提升最终达成目标,实际上这就是一个闭环过程。

  乌鸦喝水的故事可以引申至机器学习及机器人学习领域。我们团队在通过机器人深度学习研究可解释性问题时,就参考乌鸦的学习过程。它在喝水的过程中到了感知过程,就是大脑、眼睛和行为之间形成的行为共融。通过不断地从感知到行为的闭环过程实现了认知,并且实现了非常复杂的操作过程。机器人学习也就是和环境交互过程当中,从感知到行为,再从行为到感知的认知过程。

  于是我们提出了一个主动感知的概念,主动感知由三个部分组成:一部分是传感器主动,传感器怎样才能最快地找到感兴趣的目标;另一部分是感知模式主动,传感器究竟如何做到包括行为的选择在内的模态选择?机器人能不能像乌鸦一样,通过不断的实践越来越精明?我们称其为“发育”。

  搞自动化的人会使用“主动控制”这个词。就是在坐标系当中的目标,通过非线性滤波使得它总是能处于视场中心,但是如果目标不在你的视场当中,那要怎样才能找到它?如果伪装、遮挡或者变形后,你能找到它吗?我们可以通过场景运动的办法,通过对抗式学习实现这样一种认识过程。

  人类有一个优点即选择注意机制,人的视觉系统就有这种注意机制。比如人会对大的、近的、色彩对比度比较大的物体感兴趣,如何将人视觉的认知过程和机器人的检测结合?我们团队将金字塔模型具有认知过程跟卷积网络结合,实现了多尺度不同大小的检测,提高它的检测率。

  比如无人车通过某个角度看物体的检测率比较低,通过深度强化学习后它会找到一个合适位置,而在这个位置上检测率便大大提高了,就是从感知到行为的交互过程。

  一个机器人装载了许许多多的传感器,能不能做到面向任何场景时,不需要的传感器可以关掉,等到要用的时候再打开?在航天领域比如嫦娥四号巡视车就特别需要这种技术。

  还有,能不能根据场景和任务选择不同的传感器?不同的传感器由于视角的不同,其视觉效果也不同,那么哪个角度效果更好?

  此外,触觉和动作行为有关,雷达和扫描方式也有关系,能不能迅速确定最好的模态内行为?这都是摆在我们面前非常重要的问题,可以通过强化学习来实现。

  又比如我们强调感知是为动作服务的,而动作又会对感知产生作用,联合学习的过程是不是也需要发育和学习?我认为,这都是未来机器人学习当中非常重要的部分。

  《高科技与产业化》:请您展望一下未来机器人主动感知与技能学习的发展方向等。

  孙富春:云端智能对未来技能的学习非常重要。技能学习需要通过各种传感器获得信息,包括视觉、听觉、触觉等,也可以通过云端和网上信息找到各种类似的操作行为。

  这些数据应该怎么处理?如何把这些多模态的信息分解在一个一个动作,并且形成多模态的配对?这牵涉到技能的分割和解析的过程,通过这两个过程就可以实现操作技能的表达。而这种知识表达是分层的,在此基础上做到技能的学习和增强,可以做各种各样的事情。比如我国3C行业中最大的一个问题就是非标准件的安装和插件的操作——因为标准件有大有小且各式各样,宽线、窄线都有,那么机器人有没有这种操作能力?宽带可以插,短线也可以插?这就需要技能迁移和增强学习。

  目前我国3C行业一年的产值为15万亿元,而GDP约为90万亿元。很多标准件装配均可用机械完成,但是非标准件和插线现在都是通过人工实现。如果我们将这部分用人工智能替代,可以将工作效率提高200%以上。

  做人工智能一定要做有用的人工智能,机器人一定要落地。我们特别希望这项技术能够改变我国3C行业制造的现状,以造福我们国家的智能制造发展。

  《高科技与产业化》:现在的用户在拨打移动或者联通客服时,很多时候都是智能机器人在与其对话。但是经常会出现机器人听不懂而一直重复的情况,将来这个问题能否得到有效的解决?

  孙富春:有观点认为2017年是对话机器人的元年,从那时候开始,对话机器人开始进入我们的家庭。如今订飞机票、支付移动话费都有聊天机器人帮助我们,但目前知识库做的还不够全,用户提的问题并没有涵盖其中,它难以产生推理。

  要让机器人学会学习,这是2018年国际人工智能大会提出的重要议题,叫做元学习。在机器人数据库没有覆盖的地方,能不能让它学会回答类似的问题?就是让和知识库中很接近的问题向外推广,学会学习。

  2017年是聊天机器人的元年,2018年推出“元学习”,不久的将来一定能够满足在特定行业当中的聊天需要。清华大学已经研制了一款餐厅里的聊天机器人,基本可以涵盖一个餐厅点菜的能力。

  《高科技与产业化》:现在人工智能和云非常普及,生活中使用机器人的情况也越来越多,但安全性的问题却一直没有得到解决。我们看过很多科幻电影,其中的情节都是机器人叛变了人类。请问您怎么看待机器人的安全问题?

  孙富春:这其中其实包含两个小问题:一个是机器人被动犯错,另一个是机器人主动犯错。被动犯错可以通过传感器技术及设置安全算法解决。主动犯错则牵涉到机器人是否已经具有自我意识,而这个问题是目前讨论最多的话题。

  什么是意识?意识是记忆,也有学说认为意识是量子纠缠,还有一种学说认为意识是感知包,没有感知怎么形成意识?将来机器要产生意识,也要有自己的语言。人类是有语言后才产生更高级的智能,所以我认为意识距离机器人还很远。因为人是探知产生的意识,硅是否能够产生人的意识?科学仍然需要不断地研究,但有一点可以明确的是,现在我们正在将碳智能和硅智能结合起来研究新型材料,至于未来会不会让机器人产生意识?这个问题还在研究当中。

首页投稿广告关于我们联系我们

版权:《高科技与产业化》编辑部版权所有 京ICP备12041800号

地址:北京市海淀区中关村北四环西路33号 邮编:100080

联系电话:(010)82626611-6618 传真:(010)82627674 联系邮箱:hitech@mail.las.ac.cn