1. 毕业设计(论文)主要目标:
论文主要建立在国外垃圾短信鉴别的基础上,分析黑白名单技术,客户端提取发送短信的地址,短信文本的特征鉴别是否为垃圾短信,重点从短信文本数据分析,从文本数据中提取关键值进行分析,主要运用贝叶斯判别分析方法验证若干数据的运行结果,根据结果分析优化模型,最后得出较低的失误率,通过对垃圾短信敏感词汇的更新填充,得出垃圾短信的文本数据分析方法,对比国内外的研究成果,国内垃圾短信处理方式在文本数据处理方式上的欠缺,本文的关键词过滤系统和文本长度对垃圾短信的鉴别,虽产生于外文短信,但其模式适用于中文短信的鉴别。垃圾短信敏感词汇的更新也提高了判别的效率和成功率。
2. 毕业设计(论文)主要内容:
该论文主要的研究方式是判别分析,首先对查找的数据分类研究,分为垃圾短信和正常短信,在两类短信中各提取一部分数据,运用文本数据的特征值提取方法,提取数据中的敏感词汇,过滤掉不影响正文的标点,停用词等字符串,以及用来承接短信上下文的连词,常用的无意义词汇,如the,off,a等,算出所得各个词汇对应的字频率和出现的概率,应用贝叶斯方法求出是正常短信和非正常短信的概率,其次任意的抽取数据中的若干文本数据项进行分析,判别分析得出该研究方法判别是否为垃圾短信的失误率,然后根据对应的失误率高低对模型进行优化调整得出结论。
3. 主要参考文献
[1]薛毅,陈丽萍.R统计建模与R软件[M].北京:清华大学出版社,2007:385-397.
[2]李雯.基于贝叶斯技术的邮件过滤[D].山东:山东师范大学,2008.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。