全文总字数:2684字
1. 毕业设计(论文)主要内容:
移动机器人的路径规划是指在有障碍物的工作环境中,如何寻找一条从给定起点到终点的适当的运动路径,并使得机器人在运动过程中能安全、无碰地绕过所有障碍物。随着人工智能的迅猛发展,机器学习相关方法为机器人系统的路径规划问题提供了可行的方法。强化学习作为机器学习的一个重要分支,它把学习分成“试探-评价”的过程,通过环境对选择动作的评价来指导学习,利用不断试错和选择,逐步改进动作选择策略,最后达到学习的目的,从而使机器人系统与复杂的动态环境建立一种交互关系。强化学习的适应性和自学习性,使得将其运用在路径规划中,不需要建立精确的环境模型,而且可以同时解决机器人系统避碰、避障和目标抵达问题。
随着应用领域的增加和任务的复杂化,多个机器人可以通过协作完成单个机器人无法完成的复杂任务。协作是多机器人系统的核心,在强化学习中,所有机器人在追求一个共同的目标过程中彼此通信、合作,在与环境的交互过程中,通过获取到的环境信息和收到的其他机器人的经验来自行调整自身的行为。但是强化学习存在的主要问题是学习速度和收敛性问题,随着机器人数量的增加,状态空间和动作空间都会呈指数增长,计算难度更大,造成维度灾难问题;而且由于强化学习没有明确的教师信号,机器人在于环境的交互过程中,采用完全试探的方法,仅仅依靠外部的评价来调整自己的行为。这两个问题是强化学习应用在多机器人复杂环境系统中存在的主要问题,也是当前研究学者一直关注的问题。
对于智能车间而言,一个高效的调度系统是提升整个车间系统效率的核心。智能车间调度环境由一定数量的工作台、智能机器人等组成,通过调研实际车间AGV的作业场景,本文拟先建立一个单机器人的车间调度模型,使用强化学习算法使机器人通过快速的学习找到最优路径,在单个机器人的基础上,考虑多机器人的避障和算法的收敛性,对算法进行改进,使其能解决多机器人路径规划问题,并通过仿真实验对所设计的算法的有效性进行验证。
2. 毕业设计(论文)主要任务及要求
1.查阅国内外关于强化学习及其在多机器人路径规划方面应用的论文文献,了解其存在的主要问题和解决办法;
2.学习强化学习的常用算法和改进方法的基本原理,并能用Matlab编程实现;
3.调研车间AGV作业场景。根据实际情况对单个机器人和多个机器人的车间环境进行建模,并能仿真实现;
3. 毕业设计(论文)完成任务的计划与安排
1-3周 进行相关文献的查阅、英文文献的翻译,并撰写开题报告;
4-5周 学习强化学习算法基本原理和编程环境;
6-8周 设计仿真模型,并对单个机器人的路径规划进行实现;
4. 主要参考文献
[1]马磊,张文旭,戴朝华.多机器人系统强化学习研究综述[J].西南交通大学学报,2014,49(06):1032-1044.
[2]Research onReinforcement Learning Aided by Expert Knowledge and Its Application in PathPlanning of UAV. Wang G F.2017
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。