气象灾害在微博上传播的信息聚合研究任务书

 2021-08-20 00:10:39

1. 毕业设计(论文)主要目标:

随着互联网的普及和应用,微博因其能快捷方便发布信息已成为网络发展的热门聚焦点。如何有效成功挖掘分散无序的微博信息内容背后隐藏的隐性价值成为微博文本分析的热点。

2. 毕业设计(论文)主要内容:

1.数据采集。本研究以新浪微博为对象,应用爬虫软件来从互联网上收集所需信息。

2.分词。通过中文分词系统对微博文本的内容首先进行分词;继而根据哈尔滨工程大学提供的中文停用词表对分词结果进行筛选,人工对各个文本分词去除停用词。

3.利用Bibexcel获得关键词以及词频,依据所得关键词的频数进行从高到低的排序取频数大于20的词作共词矩阵。通过Ucinet6.0对文本进行进一步分析,得到与气象灾害有关的关键词主题,挖掘出微博文本后有关气象灾害的特征词。

4.通过SPSS进行聚类分析,对所得到的关键词矩阵进行聚类。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 主要参考文献

[1] 姜恩波 .基于信息聚合的服务与技术[ J] .现代图书情报技术 , 2007(4):32-34
[2]Mangalindan J P,Dick Costolo: Twitter has 100 million active users[EB/OL].[2011 - 09 - 08]. http: / /tech. fortune. cnn. com/2011 /09 /08 /twitter-has-100-million-users/.
[3]时睿,封化民. 一种基于名词的微博语义计算方法[J]. 北京电子科技学院学报,2011( 4) : 16 - 22.
[4] 姜恩波.基于信息聚合的服务与技术[ J] .现代图书情报
技术, 2007(4):32-34.
[5] 左雄辉, 糜麒.个性化搜索引擎研究[ J] .计算机工程与
应用, 2005 (17):190-192.
[6] 黄少林.基于用户分析的个性化搜索引擎研究[ D] .北
京:首都师范大学, 2009 (4).
[7] 刘鹏, 顾军, 周勇.面向下一代网络的开放式API技术研
究[J].计算机技术与发展, 2006(2):56-58.
[8] 文洪刚.Web3.0提供基于用户偏好的个性化聚合服务
[ EB/OL] .[ 2010-12-05].http://www.whymeet.cn/post/
26.Html
[9] Liu Zitao. Short text feature selection for micro-blog mining[C]/ /Shen Heng tao,Zhang Yanchun. Proceedings of International Conferenceon Computational Intelligence and Software Engineering.Wuhan: IEEE,2010: 1 - 4.
[10] 林小俊,张猛,暴筱,等. 基于概念网络的短文本分类方法[J]. 计算机工程,2010( 21) : 4 - 6.
[11]曹鹏,李静远,满彤,等. Twitter 中近似重复消息的判定方法研究[J]. 中文信息学报,2011( 1) : 20 - 27.
[12]王永恒,贾焰,杨树强. 海量短语信息文本聚类技术研究[J].计算机工程,2007( 14) : 38 - 40.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。