1. 毕业设计(论文)主要内容:
淘宝交易数据分析往往依赖于对大量的历史数据的分析,如何通过交易的历史数据,对股票进行分析,从中挖掘出有价值的信息,一直是广大商家所面临的难题。但随着网购交易所积累的交易数据越来越多,传统分析法无法有效的处理大规模的数据,也难以从大量的数据中主动的发现各种潜在的有用信息。
本设计主要内容包括:1.调研淘宝交易数据分析方法的研究现状;2.分析淘宝交易数据的特点以及相关需求,对淘宝交易数据分析所需要相关技术和算法进行了研究学习;3.学习Spark分布式计算平台相关技术;4.完成基于Spark的回头客预测过程,该过程包括数据接入、数据分析、结果输出等阶段,并在框架预定义的组件中分别编程实现,各组件通过数据流连通形成任务实体,提交到集群完成运行。
2. 毕业设计(论文)主要任务及要求
(1)查阅15篇相关文献(含2篇外文),并每篇书写200—300字文献摘要(装订成册,带封面);(2)认真填写周记,完成800字开题报告;(3)完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);(4)完成系统的编码与调试;(5)完成10000字以上的毕业论文;(6)进行论文答辩。
3. 毕业设计(论文)完成任务的计划与安排
(1) 2017/1/14—2017/2/22:确定选题,查阅文献,外文翻译和撰写开题报告;
(2) 2017/2/23—2017/4/30:系统架构,程序设计与开发,系统测试与完善;
(3) 2017/5/1—2017/5/25:撰写及修改毕业论文;
4. 主要参考文献
[1] 1.Holden,Andy Konwinski, Pantrick Wendell等.Spark快速大数据分析.人民邮电出版社.2015年
[2] 2.詹义,方媛.基于Spark技术的网络大数据分析平台搭建与应用.《互联网天地》,2016(2):75-78.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。