基于网络爬虫的信息采集系统设计与实现任务书

 2021-08-20 23:32:43

1. 毕业设计(论文)主要内容:

我们正处在一个信息爆炸的时代,如何在海量的信息中抽取有价值的信息,是急需解决的一个关键问题,本课题在了解和熟悉网络爬虫技术特点以及功能作用的基础上,采用Java语言以及一种搜索引擎技术设计并开发一款主题爬虫。

2. 毕业设计(论文)主要任务及要求

(1) 1-3周,根据毕业设计的要求查阅相关资料,明确研究内容,确定研究方案完成开题报;

(2) 4-6周,根据开题报告的研究内容和研究方案,深入学习搜索引擎技术以及网络爬虫开发流程,完成相关专业英语的翻译;

(3) 7-9周,学习与掌握JAVA编程语言以及集成开发环境,完成需求分析;

(4) 10-12,开发相关的基于某一主题的网络爬虫;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

(1) 查阅不少于15篇的相关资料,其中英文文献不少于2篇,完成开题报告。

(2) 了解网络爬虫的发展历程,分析网络爬虫的开发框架,基于一种搜索引擎技术开发一种主题网络爬虫。

(3) 熟悉与掌握JAVA编程语言以及有关的数据库技术,并熟悉Eclipse集成开发环境。

(4) 完成不少于5000汉字的英文文献翻译。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] 明日科技编著. 《Java从入门到精通》[M]. 清华大学出版社,2012.

[2] 谭浩强主编. 《Java程序设计》[M]. 清华大学出版社,2013.

[3] 刘金红,陆余良. 《主题网络爬虫研究综述》[J]. 计算机应用研究,2007,24(10):26-30.

[4] 罗刚,王振东. 《自动动手写网络爬虫》[M]. 清华大学出版社,2010.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。