1. 毕业设计(论文)主要目标:
1、研究文本数据的特征选择方法以及它们的优缺点
2、研究常用的几种文本分类方法
3、研究文本分类方法的性能评价指标
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 毕业设计(论文)主要内容:
1、运用改进的卡方统计对邮件数据进行特征选择,分别用朴素贝叶斯及k近邻法对邮件进行分类,并利用查全率、查对率、宏平均、微平均以及F1值对分类方法进行性能评估
2、运用互信息对邮件数据进行特征选择,分别用朴素贝叶斯及k近邻法对邮件进行分类,并利用查全率、查对率、宏平均、微平均以及F1值对分类方法进行性能评估
3、比较在相同的特征数目下,改进的卡方统计和互信息的性能
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 主要参考文献
[1]张鹏招.基于卡方统计的中文文本分类特征选择方法研究[D].重庆大学,2008.
[2]肖婷,唐雁.改进的卡方统计文本特征选择方法[J].计算机工程与应用,2009,45(14):136-137.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。