1. 毕业设计(论文)主要目标:
设计并实现基于spark平台的数据挖掘并行化方法,并对比分析Spark平台应用中准确性、吞吐量、处理速度等指标,验证基于Spark的数据挖掘算法的执行效率和并行化效果。
2. 毕业设计(论文)主要内容:
本文围绕大数据平台Spark和数据挖掘两个概念:
(1)对Spark平台做出详细的分析,同时对数据挖掘算法进行了分析和总结;
(2)基于Spark作为引擎核心和编程模型,设计并实现部分并行化数据挖掘算法;
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 主要参考文献
[1]DeanJ,Ghemawat S.Map Reduce:Simplified DataProcessingon LargeClusters[J]. Communicationsof the ACM, 2008, 51 (1): 107-113.
[2]Gupta S, Dutt N, Gupta R, et al. SPARK: A HighLevel Synthesis Framework for Applying ParallelizingCompiler Transformations[C].NewDelhi: Proceedings16thInternational Conference on VLSI Design,2003: 461-466.
[3]Lhotak O,HendrenL. ScalingJavaPoints ToAnalysisUsing Spark[M].Compiler Construction.Berlin: Springer, 2003: 153-169.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。