基于JAVA的分布式爬虫设计与实现任务书

 2021-08-21 22:13:56

1. 毕业设计(论文)主要内容:

1、完成框架的搭建以及数据库设计;

2、设计相关算法,若有复杂的数据结构需求,使用相应集合框架,利用正则表达式匹配相关数据;

3、实现完整的系统,包括数据访问层,页面显示层等,最终Java源代码至少在1000行以上。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

1. 查阅相关文献资料不少于15篇,其中近五年外文文献不少于3篇;

2. 完成开题报告;

3. 使用Java与HTML解析工具jsoup以及MySQL数据库实现一个网络爬虫,针对新浪微博采用网络爬虫技术进行舆论信息的采集。 将获取到的数据存储到数据库中,为以后数据分析做准备。完成系统设计。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

第1周—第4周:查阅相关文献资料,明确研究内容,了解研究所需。确定方案,完成开题报告;

第5周—第8周:完成主要研究工作,撰写论文初稿;

第9周—第12周:撰写论文;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] 董日壮,郭曙超. 网络爬虫的设计与实现[A] .电脑知识与技术. 2014.

[2] 杨青松. 爬虫技术在互联网领域的应用探索[A] .电脑知识与技术.2016.

[3] 张明杰. 基于网络爬虫技术的舆情数据采集系统设计与实现[A] . 现代计算机(专业版).2016.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。