基于Hadoop架构的K-Means聚类算法研究任务书

 2021-12-28 20:47:38

全文总字数:1484字

1. 毕业设计(论文)主要内容:

随着近几年互联网和移动互联网的高速发展,我们也将跨入一个数据爆炸的时代。

而数据量的急剧增长对传统的数据挖掘算法提出了新的挑战。

因此如何在大数据环境下高效准确地挖掘出数据中的有价值的信息成为了一个亟需解决的问题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

1.查阅15篇相关文献(不少于3篇外文文献),并每篇书写200—300字文献摘要(装订成册,带封面);2.认真填写周记,完成至少1500字开题报告(“设计的目的及意义”至少800汉字;“基本内容和技术方案”至少400汉字;进度安排应尽可能详细;教指导教师意见应包含:学生的调研是否充分?基本内容和技术方案是否已明确?是否已经具备开始设计(论文)的条件?能否达到预期的目标?是否同意进入设计(论文)阶段?);3.完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);4.完成系统的编码与调试;5.完成10000字以上的毕业论文;6.进行论文答辩。

3. 毕业设计(论文)完成任务的计划与安排

(1)2020/1/13—2020/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;(2)2020/3/1—2020/4/30:系统架构、程序设计与开发、系统测试与完善;(3)2020/5/1—2020/5/25:撰写及修改毕业论文;(4)2020/5/26—2020/6/5:准备答辩。

4. 主要参考文献

1. Hartigan, John A., and Manchek A. Wong. "Algorithm AS 136: A k-meansclustering algorithm." Journal of the Royal Statistical Society. Series C(Applied Statistics) 28, no. 1 (1979): 100-108.2. Wu, Xindong, Vipin Kumar, J. Ross Quinlan, Joydeep Ghosh, Qiang Yang,Hiroshi Motoda, Geoffrey J. McLachlan et al. "Top 10 algorithms in datamining." Knowledge and information systems 14, no. 1 (2008): 1-37.3. Kantardzic, Mehmed. Data mining: concepts, models, methods, andalgorithms. John Wiley Sons, 2011.4. 韩家炜, 坎伯. "数据挖掘: 概念与技术." 北京机械工业出版社,2001.5. 周爱武, 于亚飞. "K-Means 聚类算法的研究." 计算机技术与发展 21, no. 2(2011): 62-65.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。