全文总字数:1489字
1. 毕业设计(论文)主要内容:
大数据时代,数据流在各个应用领域源源不断的产生,如网上购物交易记录、交通流量监测数据和卫星探测数据等。
数据流实时到达、连续多变和海量无限等特性使得传统的数据挖掘方法难以保证良好的适用性,因此,如何针对数据流的特性对其进行有效的知识挖掘,已经成为数据挖掘领域的热点和难点之一。
集成分类是一种有效的数据流分类方法,该类方法主要思想是建立多个基分类器,然后对基分类器进行集成,同时根据基分类器表现对其进行评价,剔除性能较差的基分类器,实现集成模型的更新,从而提高集成分类模型的性能。
2. 毕业设计(论文)主要任务及要求
(1)查阅相关文献资料15篇以上(其中近5年外文文献不少于3篇)。
(2)完成开题报告及任务书。
(3)掌握在线集成学习算法的基本概念和知识,并对主流方法进行细致的总结和分析,理解和掌握在线集成学习的理论、实现过程及优化方法,掌握OnlineBagging、Online Boosting等代表模型的算法原理。
3. 毕业设计(论文)完成任务的计划与安排
(1)第1-3周:查阅相关文献资料,明确研究内容,了解研究所需的理论知识。确定方案,完成开题报告。
(2)第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉相关工具软件的使用;
(3)第6-9周:实现系统各功能模块设计。
4. 主要参考文献
[1]韩杰. 基于集成学习的数据流分类算法研究[D].合肥工业大学, 2018.
[2]袁泉,郭江帆,赵学华.一种基于集成的不均衡数据流分类算法[J].计算机工程与科学,2019,41(08): 1519-1524.
[3]Gomes H M, Bifet A, Read J. Adaptive random forests for evolving data stream classification[J].Machine Learning, 2017, 106(9-10): 1469-1495.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。