简单讲解在机器人领域中机器学习都发挥了哪些
相信大家在观看吴恩达机器学习公开课的第一节课中,印象比较深的有使用强化学习去训练与控制机器人,直升飞机,让它们学会新的技能。
那么,机器学习在机器人中有哪些应用呢?本文将对这个问题进行简单的介绍。
1.计算机视觉
因为机器人视觉不仅涉及到计算机算法,有些人会认为正确的术语是机器视觉或机器人视觉。机器人学家或工程师也必须选择摄像头硬件能够允许机器人处理物理数据。机器人视觉与机器视觉密切相关,后者用于引导机器人引导和自动检测系统。它们之间的微小差异可能在应用于机器人视觉的运动学中,其包括参考框架校准和机器人对其环境的物理影响的能力。
大量数据即网络上可用的视觉信息(包括注释/标记的照片和视频)的涌入推动了计算机视觉的进步,这反过来也有助于进一步基于机器学习的结构化预测学习技术,推动机器人视觉应用,如物体的识别和排序。一个分支的例子是无人监督学习的异常检测,例如能够使用卷积神经网络找到并评估硅芯片故障的建筑系统,由BiomimeTIc机器人和机器学习实验室的研究人员设计,该研究人员是非营利机构AssistenzroboTIk的一部分电子伏特在慕尼黑。诸如雷达,激光雷达和超声波等超感知技术也推动了自主车辆和无人机的360度视觉系统的开发。
2 .模仿学习
模仿学习与观察学习密切相关,这是婴幼儿展示的行为。模仿学习也是强化学习的总体类别,也是让agent在世界范围内采取行动的最大挑战。贝叶斯或概率模型是这种机器学习方法的常见特征。模仿学习是否可以用于类人机器人的问题早在1999年就被假定了。
模仿学习已经成为现场机器人技术的一个组成部分,其中一些工厂的移动特性,如建筑,农业,搜索和救援,军事等领域的移动特性使手动编程机器人解决方案变得具有挑战性。例子包括逆向优化控制方法,或者通过演示进行编程(PbD).CMU和其他组织在类人机器人,腿式运动和越野粗糙地形移动导航仪领域中得到应用。亚利桑那州立大学的研究人员在两年前发表了这个视频,展示了一个类人机器人,使用模仿学习获得不同的掌握技巧。
贝叶斯信念网络也被应用于前向学习模型,其中机器人在没有先验知识的情况下学习运动系统或外部环境。 这个例子就是motor babbling,正如伊利诺伊大学厄巴纳 - 香槟分校(UIUC)的语言习得和机器人小组所组织的,Bert是iCub人形机器人。
3.自我监督学习
自我监督的学习方法使机器人能够生成自己的培训示例,以提高性能;这包括使用先验训练和数据捕获近距离来解释远程不明确的传感器数据。它被并入机器人和光学设备中,可以检测和排除物体(例如灰尘和雪);识别崎岖地形中的蔬菜和障碍物;并在3D场景分析和建模车辆动力学。
Watch-Bot是一个具体的例子,由Cornell和Stanford的研究人员创建,它使用3D传感器(Kinect),相机,笔记本电脑和激光笔来检测正常的人类活动,这是通过概率方法学习的模式。 Watch-Bot使用激光笔将目标对象作为提醒(例如,留在冰箱中的牛奶)。在初始测试中,机器人能够成功地提醒人类60%的时间(它没有理解它在做什么或为什么),研究人员通过允许其机器人从在线视频(称为项目RoboWatch)学习扩展了试验。
应用于机器人技术的自我监督学习方法的其他示例包括在具有道路概率分布模型(RPDM)和模糊支持向量机(FSVM)的前视单目相机中的道路检测算法,在麻省理工学院为自主车辆设计和其他移动在路机器人。
自主学习是一种涉及深度学习和无监督方法的自我监督学习的变体,也被应用于机器人和控制任务。伦敦帝国学院的一个团队与剑桥大学和华盛顿大学的研究人员合作,创造出一种加快学习的新方法,将学习模式不确定性(概率模型)纳入长期规划和控制器学习,从而减少影响的学习新技能的模型错误。
4.辅助和医疗技术
辅助机器人是一种可以感知,处理感官信息并执行有益于残疾人和老年人的行为的设备(虽然智能辅助技术也适用于一般人群,如驾驶员辅助工具)。运动治疗机器人提供诊断或治疗益处。这些都是大部分(不幸的是)仍然局限于实验室的技术,因为对于美国和国外的大多数医院来说,这些技术仍然是成本高昂的。
辅助技术的早期例子包括由斯坦福大学和帕洛阿尔托退伍军人事务康复研究与发展公司于1990年代初开发的DeVAR或台式职业助理机器人。目前正在开发最新的基于机器学习的机器人辅助技术的例子,其中包括组合更多自主性的辅助机器,例如通过Kinect Sensor观察世界的MICO机器人手臂(Northwester University开发的)。这些影响更复杂,更智能的辅助机器人可以更容易地适应用户需求,但也需要部分自主权(即,机器人与人之间的共享控制)。
在医学界,机器人学习方法的进步正在迅速发展,尽管在许多医疗机构中并不容易。通过Cal-MR:医疗机器人自动化和学习中心,多所大学的研究人员和医生网络(与多家大学和医生的研究人员的合作)导致了智能组织自主机器人(STAR)的创建,通过自主学习和3D感应技术的创新,STAR能够以比最好的人类外科医生更好的精度和可靠性将猪肠(用于代替人体组织)拼接在一起,研究人员和医生说明STAR不能替代外科医生 - 在可预见的将来,谁将在附近处理紧急情况 - 但是在执行类似类型的精巧手术方面提供了重大的好处。
5. 多Agent学习
协调和协商是多Agent学习的关键组成部分。它涉及到了基于机器学习的机器人(或agent,目前关于agent的相关技术已被广泛应用于游戏),能够适应其他机器人/代理人的转变格局,并找到均衡多代理学习方法的例子包括不遗余力的学习工具。其中主要涉及到强化学习算法,加强多agent策划中的学习成果,以及基于市场的分布式控制系统的学习。
一个更具体的例子是分布式agent或机器人的研究人员创建的算法,由麻省理工学院的信息和决策系统实验室在2014年底。机器人协作构建一个更好,更包容的学习模型比一个机器人(更小的信息块处理,然后结合),基于探索建筑及其房间布局的概念,自主建立知识库。
每个机器人构建自己的目录,并结合其他机器人的数据集,分布式算法在创建此知识库方面优于标准算法。虽然不是一个完美的系统,但是这种机器学习方法使得机器人可以比较目录或数据集,加强相互观察和正确的遗漏或过度泛化,无疑将在几个机器人应用中发挥近期的作用,包括多个自治地和空降车。