1. 毕业设计(论文)主要内容:
周期性地从各个新闻网站爬取热点新闻及其公众评论列表,针对每个评论列表利用自然语言处理算法进行基本语言和情感分析。
汇总评论列表里的评论情绪,选择出比重最大的两到三个情绪以代表舆论对于该新闻的看法,并将每个新闻的结果以网页的方式呈现。
使用爬虫框架 crawler4j 制作爬取新闻网站的爬虫。
2. 毕业设计(论文)主要任务及要求
1.查阅15篇相关文献(含近五年外文3篇),并每篇书写200—300字文献摘要(装订成册,带封面);
2.认真填写周记,完成800字开题报告;
3.完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);
3. 毕业设计(论文)完成任务的计划与安排
(1)2020/1/11—2020/1/22:查阅参考文献,明确选题;
(2)2020/1/23—2020/3/7:进一步阅读文献,并分析和总结;确定技术路线,完成并提交开题报告;
(3)2020/3/8—2020/4/26:需求分析,算法或系统设计,分析、比较或实现等;
4. 主要参考文献
参数书目:《Web Scraping with Python-Collecting Data from the Modern Web》、《网络爬虫全解析——技术、原理与实践》、《Documentsof crawler4j》参考书目:《自然语言处理入门》、《Speech and Language Processing 》、《Natural LanguageProcessing with Java》、《Documents of HanLP》、《NLP 技术对主观评教数据进行情感分析的应用探索》、《基于 Word2Vec, LSTMs 和 Attention 机制的中文情感分析研究》《深入浅出 Spring Boot 2.x》、《Spring Data 实战》《MySQL Crash Course》等。
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。