1. 毕业设计(论文)主要内容:
在互联网高速发展的时代,各种网络论坛已经成为人们主要信息来源,最活跃的社区,各种爆料、头条等成为这个时代信息传播蔓延的的种子,加上网络空间的自由性,对这部分信息进行有效管控是社会舆情监控的重要内容,也是引导社会健康发展的必要手段。结合信息检索、自然语言处理、文本挖掘技术及网络舆论传播学,将基于Lucene的的全文检索引擎技术引入校园论坛监测系统之中,方便论管理员更快的查找和获取论坛当前的热点信息,从而及时的对某些热帖进行相应处理,减少敏感话题带来的负面影响。系统后台根据管理员需求设定关键词库,监控系统根据关键词库定时搜索论坛发现敏感话题。主要内容如下:
1.熟悉网络爬虫程序,采用开源的爬虫工具采集指定网站的网页。 2.采用Heritrix、Lucene工具包对采集到的信息进行分词、索引、排序、生成摘要等。 3.设计论坛热点识别算法,发现论坛热点,并根据预设关键词判断当前热点是否违规,实现对论坛违规信息的检测与监控。 4.开发对论坛的监控原型系统。
2. 毕业设计(论文)主要任务及要求
1. 阅读15篇相关文献(不少于3篇外文文献),并每篇书写200~300字文献摘要(装订成册,带封面); 2. 认真填写周记,完成至少1500字幵题报告(“设计的目的及意义”至少800汉字;“基本内容和技术方案”至少400汉字;进度安排应尽可能详细;教指导教师意见应包含:学生的调研是否充分?基本内容和技术方案是否已明确?是否已经具备幵始设计(论文)的条件?能否达到预期的目标?是否同意进入设计(论文)阶段?); 3. 完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面); 4. 完成系统的编码与调试; 5. 完成10000字以上的毕业论文; 6. 进行论文答辩。
3. 毕业设计(论文)完成任务的计划与安排
1. 2020/1/13—2020/2/28:确定选题,查阅文献,外文翻译和撰写开题报告; 2. 2020/3/1—2020/4/30:系统架构、程序设计与开发、系统测试与完善; 3. 2020/5/1—2020/5/25:撰写及修改毕业论文;4. 2020/5/26—2020/6/5:准备答辩。
4. 主要参考文献
[1]吴绍忠, 李淑华. 互联网络舆情预警机制研究[J]. 中国人民公安大学学报(自然科学版), 2008,(03) :38-42[2]宗成庆. 统计自然语言处理. 北京:清华大学出版社. 2008.[3]朱嫣岚, 闵锦, 周雅倩,黄萱菁,等. 基于How-net 的词汇语义倾向计算. 中文信息学报, 2006, 20 (1) :14-20.[4]北大方正技术研究院. 以科技手段辅助网络舆情突发事件的监测分析——方正智思舆情辅助决策支持系统. 信息化建设, 2005,(10)[5]谢海光, 陈中润. 互联网内容及舆情深度分析模式. 中国青年政治学院学报.2006.3.[6]侯广坤, 邓卫字. 人工智能概论. 广州:中山大学出版社, 1993.[7]Vasileious HatZivassiloglou, Kathleen R. MeKeown. Predicting the semantic orientation of adjectives. In: Proceedings of the 35th Annual Meeting of the Association for Computational Liguistics and the 8th Conference of the European Chapter of the ACL,1997:174-181.[8]Turney, Peter. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews. Proceedings 40th Annual Meeting of the ACL, pp. 417-424.[9]David M. Blei, Pedro J. Moreno. Topic Segmentation with an Aspect Hidden Markov Model. SIGIR 2010: 343-348.[10]John Lafferty and Chengxiang Zhai. Document Language Models, Query Models, and Risk Minimization for Information Retrieval. SIGIR2008:111-119.[11]Donald Metzler and W. Bruce Croft. Latent Concept Expansion Using Markov Random Fields. SIG2007: 311-318.[12]黄昌宁等, 自然语言理解与机器翻译, 清华大学出版社, 2001.[13]郭艳华, 周昌乐. 自然语言理解研究综述. 杭州电子工业学院学报. 2000, 20(1):58-65[14]黄昌宁, 李涓子. 语料库语言学. 北京商务印书馆, 2002.[15]刘挺, 王开铸. 基于篇章多级依存结构的自动文摘研究. 计算机研究与发展. 1999, 36 (04): 479-488[16]吴岩, 刘挺, 王开铸, 陈彬. 中文自动文摘原理与方法探索. 中文信息学报, 1998, 12 (02): 8-16[17]晋耀红. HNC(概念层次网络)语言理解技术及其应用. 北京:科学出版社, 2006.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。