1. 毕业设计(论文)主要目标:
爬取目标网站的数据,并对数据进行结构性的分析,将分析后的数据展示在页面上。
2. 毕业设计(论文)主要内容:
通过JAVA实现了一个基于广度优先算法的多线程爬虫程序。论文阐述了网络爬虫实现中一些主要问题:为何使用广度优先的爬行策略,以及如何实现广度优先爬行;为何要使用多线程,以及如何实现多线程;系统实现过程中的数据存储;网页信息解析等。通过实现这一爬虫程序,可以搜集某一站点的URLs,并将搜集到的URLs存入数据库。
3. 主要参考文献
[1]萨师煊,王珊.《数据库系统概论(第四版)》.高等教育出版社,2002.
[2] 黄梯云,李一军.《管理信息系统(第4版)》.高等教育出版社,2005.
[3] 卫军,夏慧军,孟腊春.《EXTJS Web应用程序开发指南》. 机械工业出版社 ,2011.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。