全文总字数:1408字
1. 毕业设计(论文)主要内容:
OCR作为一种自动解读文档图像符号的技术,一直以来都备受关注,尤其在信息时代的今天,数字图像纷繁复杂,如何便捷高效的获取其中的文字信息,更有着重要的时代意义。文档图像二值化是文档图像分析和识别流程中的一个重要步骤。为了让计算机更快的、更好地识别文字,需要先对含有噪音的彩色图进行处理,使图片只剩下前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图。设计的内容将主要包括三个任务:图像资源的采集,模型的建立与优化,算法的详细设计,采用Python语言实现。
2. 毕业设计(论文)主要任务及要求
1)首先采集相关数据集,对其进行分析,数据增强;
2)然后搜集相关资料,建立合适的模型对数据集进行训练,并对模型进行评估和改进;
3)最后利用二值化算法,将需要处理的图像转换为二值化图,以便后续进行字符识别。
3. 毕业设计(论文)完成任务的计划与安排
1)2020/1/13—2020/2/28:查阅参考文献,明确选题;完成开题报告;翻译英文资料(不少于5000汉字),并交予指导教师检查。
2)2020/3/1—2020/4/30:对采集的相关数据集进行分析,数据增强;模型的建立与改进;二值化算法实现。
3)2020/5/1—2020/5/25:撰写及修改毕业论文。
4. 主要参考文献
[1] 周志华. 机器学习. 清华大学出版社,2016
[2] I. Pratikakis, K. Zagoris, G. Barlas and B.Gatos, “ICDAR2017 Competition on Document Image Binarization (DIBCO 2017)”, 14thIAPR International Conference on Document Analysis and Recognition, July. 03, 2017.
[3] G. chutani, T. Patnaik and V. Dwivedi ,“An Improved Approach for automatic denoising and Binarization of DegradedDocument Images Based on Region Localization”, 2015 International Conference onAdvances in Computing, Communications and Informatics (ICACCI)
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。