1. 毕业设计(论文)主要内容:
1.了解学习自然语言处理、特征提取、机器学习的基本原理和方法,学习网络爬虫程序搜集包含智能手机信息的语料,构建一个高质量的智能手机实体识别语料库。
2.学习文本挖掘中的商品品牌名和系列名的实体识别算法,研究表示智能手机相关实体的语法、语义等特征,并利用机器学习算法训练识别器。
3.基于条件随机场(Conditional Random Fields, CRF)算法的智能手机实体识别研究,对输入的每一句包含商品实体信息的句子,实现一个能够抽取出该句子所表达的商品品牌名、系列名的简易演示程序。
2. 毕业设计(论文)主要任务及要求
1. 查阅相关文献资料不少于15篇,其中近五年外文文献不少于3篇;参考文献格式符合规范。
2. 完成开题报告;
3. 了解学习自然语言处理、特征提取、机器学习的基本原理和方法,研究文本挖掘中的商品品牌名和系列名的实体识别算法,实现一个具有简单商品实体命名识别功能的演示程序;
3. 毕业设计(论文)完成任务的计划与安排
第1周—第5周:查阅相关文献资料,明确研究内容,了解研究所需。确定方案,完成开题报告。
第6周—第9周:搜集包含智能手机信息的语料,研究表示智能手机相关实体的语法、语义等特征,提出一种基于CRF算法的机器学习模型训练识别器。
第10周—第13周:对商品实体命名识别器体系结构及相关数据进行试验研究、性能评价、模型完善。
4. 主要参考文献
[1] Yang X, Huang H, Xin X, et al. Domain-Specific Product Named Entity Recognition from Chinese Microblog[C]//Computational Intelligence and Security (CIS), 2014 Tenth International Conference on. IEEE, 2014: 218-222.
[2] John Lafferty, Andrew McCallum, Fernando Pereira. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data[C].In Proc.ICML. 2001.
[3] 江会星.汉语命名实体识别研究[D]. 北京:北京邮电大学,2012.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。