1. 毕业设计(论文)主要目标:
对于一些作者同名的论文,难以分辨此论文究竟出自哪个作者。本文根据论文中所标注的机构名以及不同作者使用虚词的习惯不同,利用朴素贝叶斯分类器进行同名消歧。使论文被引频次的统计工作更为精确,同时帮助研究作者群在年龄、地域、学科领域等方面的分布情况,从而能够发现和追踪不同学科的科学前沿,辨明和研究不同领域的热点课题。
2. 毕业设计(论文)主要内容:
根据论文中所标注的机构名以及不同作者使用虚词的习惯不同,打算利用朴素贝叶斯分类器进行研究。首先在特征独立性假设的基础上, 讨论朴素贝叶斯分类器的原理, 继而应用朴素贝叶斯分类器进行将文本分类为是否属于某位学者。由于朴素贝叶斯分类器分类不存在单分类器与多分类器的实现差异且精度较高, 代码实现这方面难度应该不大,预计会有一个不错的分类正确率。
3. 主要参考文献
1[1] Guo, S.: Research on author name disambiguation algorithm in theliterature database. New Technology of Libraryand Information Service 29(Z1),69-74 (2013).
2[2]Gu, B., Sun, X.M., Sheng, V.S.: StructuralMinimax Probability Machine. IEEETransactions on Neural Networks and Learning Systems (2016). DOI : 10.1109/TNNLS.2016.2544779
3[3] Zhou, Z.L., Wang, Y.L., Wu, Q.M.J., Yang, C.N., Sun, X.M.:Effective and Efficient Global Context Verification for Image Copy Detection. IEEE Transactions on Information Forensics and Security,vol.12 no.1. pp 48-63, 2017. DOI:10.1109/TIFS.2016.2601065, 2016.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。