1. 毕业设计(论文)主要目标:
本文的探讨重点是比较不同模型在预测网络新闻流行度的精确度,寻找评估成效最好的模型。同时,我们寻找对网络新闻流行度影响最大的几个因素,从而对网络新闻的撰写提出相关建议,使得新闻最受欢迎。
2. 毕业设计(论文)主要内容:
首先,从网络新闻网站Mashable,提取UCI的数据集,初步处理数据,并且将网络新闻流行度数据集分为训练集和测试集。 然后,我们通过一般线性回归、支持向量回归、神经网络和回归树来估计一篇文章的预期分享的数量。并且通过分类算法如决策树、随机森林以及支持向量机算法来确定文章是否会受到欢迎。ROC图、AUC在本研究中被用来评价分类模型的效果。通过对每个模型的预测误差和准确率的比较,找出预测的最佳模型。同时,我们寻找对网络新闻流行度影响最大的几个因素,从而对网络新闻的撰写提出相关建议,使得新闻最受欢迎。
3. 主要参考文献
Simo Puntanen Data Analysis for Experimental Design 2009 77: 400-403
李大锋 支持向量机在基金评估中的应用 模式识别与智能系统 厦门大学 2008
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。