基于强化学习的足球任意球策略研究任务书

 2022-01-13 21:19:04

全文总字数:1279字

1. 毕业设计(论文)主要内容:

在足球比赛中,选择合适的任意球策略可提升球队的获胜可能。

在本研究中,对足球任意球系统进行建模,并编写该模拟环境,使用基于强化学习的算法进行训练,获得最佳得分策略。

2. 毕业设计(论文)主要任务及要求

主要任务:

1. 对足球任意球环境进行建模,并编写可视化模拟环境

2. 编写基于强化学习的算法,并进行训练

3. 将基于强化学习的任意球算法与其他算法进行性能比较

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

2020年1月11日-2020年1月31日:阅读相关文献,主要是关于强化学习的文献。

2020年2月1日-2020年2月28日:学习强化学习相关算法

2020年3月1日-2020年3月31日:完成游戏环境建模及可视化模拟环境搭建

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] Sutton R S, Barto A G. Introduction to reinforcement learning[M]. Cambridge: MIT press, 1998.[2] Mnih V, Kavukcuoglu K, Silver D, et al. Human-level control through deep reinforcement learning[J]. Nature, 2015, 518(7540): 529.[3] Stone P, Sutton R S, Kuhlmann G. Reinforcement learning for robocup soccer keepaway[J]. Adaptive Behavior, 2005, 13(3): 165-188.[4] Kitano H, Asada M, Kuniyoshi Y, et al. RoboCup: A challenge problem for AI[J]. AI magazine, 1997, 18(1): 73-73.[5] Hausknecht M, Stone P. Deep reinforcement learning in parameterized action space[J]. arXiv preprint arXiv:1511.04143, 2015.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。