社交网络信息采集任务书

 2021-08-20 00:58:19

1. 毕业设计(论文)主要目标:

针对基于微博、facebook、微信等社交网络,利用python爬虫采集在该社交网络的发帖、跟帖相关信息,按照分贴、分人、分地区、分时间进行数据集整理,采集数据在万条记录以上,形成可供大数据分析的原始数据集。

2. 毕业设计(论文)主要内容:

通过python爬虫相关知识的学习,针对微信,利用网络爬虫对社交网络进行信息爬取,获取与关键字相关的文章内容及其阅读量、点赞量、评论等信息,并将所获得的的信息分门别类的存储到数据库中,参考谷歌、微软的网页爬虫,结合所学的网络爬虫的知识,设计出满足要求的网络爬虫。

3. 主要参考文献

[1]Z. Zheng and D. Qian, 'An improved focused crawler basedon text keyword extraction,' 2016 5th International Conference on Computer Science and NetworkTechnology (ICCSNT), Changchun, 2016, pp. 386-390.doi: 10.1109/ICCSNT.2016.8070186

[2]Jingtao Shang, Jianjun Lin, Yan Qin, Bo Li and Mengmeng Wu,'Design of analysis system for documents based on web crawler,' 2016 2nd IEEE InternationalConference on Computer and Communications (ICCC), Chengdu, 2016, pp. 289-293.doi: 10.1109/CompComm.2016.7924710

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。