统计方法在预测网络新闻欢迎度的应用任务书

 2021-11-08 22:17:03

1. 毕业设计(论文)主要目标:

本文的探讨重点是比较不同模型在预测网络新闻流行度的精确度,寻找评估成效最好的模型。同时,我们寻找对网络新闻流行度影响最大的几个因素,从而对网络新闻的撰写提出相关建议,使得新闻最受欢迎。

2. 毕业设计(论文)主要内容:

首先,从网络新闻网站Mashable,提取UCI的数据集,初步处理数据,并且将网络新闻流行度数据集分为训练集和测试集。 然后,我们通过一般线性回归、支持向量回归、神经网络和回归树来估计一篇文章的预期分享的数量。并且通过分类算法如决策树、随机森林以及支持向量机算法来确定文章是否会受到欢迎。ROC图、AUC在本研究中被用来评价分类模型的效果。通过对每个模型的预测误差和准确率的比较,找出预测的最佳模型。同时,我们寻找对网络新闻流行度影响最大的几个因素,从而对网络新闻的撰写提出相关建议,使得新闻最受欢迎。

3. 主要参考文献

Simo Puntanen Data Analysis for Experimental Design 2009 77: 400-403

李大锋 支持向量机在基金评估中的应用 模式识别与智能系统 厦门大学 2008

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。