基于DDPG的无人船驾驶智能决策控制算法的实现任务书

 2021-12-24 16:11:23

全文总字数:1347字

1. 毕业设计(论文)主要内容:

随着人工智能技术的发展,无人驾驶领域正在飞速进步,决策控制问题是无人驾驶技术面临的重要难题,深度确定性策略梯度(DDPG)正是解决连续动作空间的状态问题关键算法基础。本课题基于目前的DDPG算法基础上,改进深度确定性策略梯度算法,进行无人船驾驶各种连续动作空间的决策控制。基于anaconda平台,设计无人船驾驶智能决策控制算法,提高算法的性能和结果。

2. 毕业设计(论文)主要任务及要求

(1)查阅相关文献资料15篇以上(其中近5年外文文献不少于3篇)。

(2)完成开题报告及任务书。

(3) 设计深度确定性策略梯度算法,用python编写代码,基于anaconda平台仿真验证,将控制算法嵌入系统,实现无人船驾驶智能决策,解决连续动作空间的状态问题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

(1)第1-4周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。

(2)第5-6周:熟悉掌握基本理论,完成英文资料的翻译,熟悉相关工具软件的使用。

(3)第7-9周:设计深度确定性策略梯度算法。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] 刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(01):1-27.

[2] CongcongLi.ARegionalTrafficSignalControlStrategywithDeepReinforcementLearning [C].中国自动化学会控制理论专业委员会.第37届中国控制会议论文集(E).中国自动化学会控制理论专业委员会:中国自动化学会控制理论专业委员会,2018:832-837.

[3] 刘建伟,高峰,罗雄麟.基于值函数和策略梯度的深度强化学习综述[J].计算机学报,2019,42(06):1406-1438.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。