1. 毕业设计(论文)主要内容:
随着信息技术的发展,数据信息呈爆炸式的增长,人们的阅读方式逐渐从纸质书籍刊物逐渐转向电子书籍,数字出版已经成为传统出版行业发展的大方向。数字图书作为数字出版的主要内容直接影响着数字出版行业的动向。为满足读者对书籍内容的需求,数字图书大多具有标签属性,为方便读者能够在成千上万本图书中根据图书的标签更快的找到满足自己需求的书籍。主题模型是一种成熟的对文本信息分类的模型,本课题利用LDA模型对数字图书标签进行分析分类,从而完成对图书自动贴标签功能,同时图书标签属性的实现能够为后续的对书籍的联合搜索提供更完善的搜索功能。
2. 毕业设计(论文)主要任务及要求
主要任务要求:1.查阅15篇相关文献(含2篇外文),并每篇书写200—300字文献摘要(装订成册,带封面);2.认真填写周记,完成800字开题报告;3.完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);4.完成系统的编码与调试;5.完成10000字以上的毕业论文;6.进行论文答辩。
3. 毕业设计(论文)完成任务的计划与安排
(1)2017/1/14—2017/2/22:确定选题,查阅文献,外文翻译和撰写开题报告;(2)2017/2/23—2017/4/30:系统架构、程序设计与开发、系统测试与完善;(3)2017/5/1—2017/5/25:撰写及修改毕业论文;(4)2017/5/26—2017/6/6:准备答辩。
4. 主要参考文献
[1] Blei David M.;AndrewY;.Ng;Micheal I. Jordan(2003).”Latent Dirichlet Allocation”.Journal of MachineLearning Research 3:993-1022
[2]张志飞,苗夺谦,高灿.基于LDA主题模型的短文本分类方法[J].计算机应用:2013,06:1587-1590
[3] Douglas A. Smith, Charles McManis: "Classification of text to subject using LDA". IEEE International Conference on Semantic Computing, 2015
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。