全文总字数:1279字
1. 毕业设计(论文)主要内容:
在足球比赛中,选择合适的任意球策略可提升球队的获胜可能。
在本研究中,对足球任意球系统进行建模,并编写该模拟环境,使用基于强化学习的算法进行训练,获得最佳得分策略。
2. 毕业设计(论文)主要任务及要求
主要任务:
1. 对足球任意球环境进行建模,并编写可视化模拟环境
2. 编写基于强化学习的算法,并进行训练3. 将基于强化学习的任意球算法与其他算法进行性能比较
3. 毕业设计(论文)完成任务的计划与安排
2020年1月11日-2020年1月31日:阅读相关文献,主要是关于强化学习的文献。
2020年2月1日-2020年2月28日:学习强化学习相关算法
2020年3月1日-2020年3月31日:完成游戏环境建模及可视化模拟环境搭建
4. 主要参考文献
[1] Sutton R S, Barto A G. Introduction to reinforcement learning[M]. Cambridge: MIT press, 1998.[2] Mnih V, Kavukcuoglu K, Silver D, et al. Human-level control through deep reinforcement learning[J]. Nature, 2015, 518(7540): 529.[3] Stone P, Sutton R S, Kuhlmann G. Reinforcement learning for robocup soccer keepaway[J]. Adaptive Behavior, 2005, 13(3): 165-188.[4] Kitano H, Asada M, Kuniyoshi Y, et al. RoboCup: A challenge problem for AI[J]. AI magazine, 1997, 18(1): 73-73.[5] Hausknecht M, Stone P. Deep reinforcement learning in parameterized action space[J]. arXiv preprint arXiv:1511.04143, 2015.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。