任意方向旋转字符识别算法研究任务书

 2022-01-04 20:29:23

全文总字数:2358字

1. 毕业设计(论文)主要内容:

基于机器视觉和模式识别技术的字符识别是文本识别的一个重要分支。由于场景文本图像不仅存在分辨率低,字体,大小,方向和排列方式也具有多样性,直接利用现有的光学字符识别技术处理,识别精度低,对应用环境变化的适应性差。而目前场景文本的识别技术往往只研究水平方向的字符,缺乏通用的文字表达模型。因此,如何快速,准确,鲁棒的定位和识别场景图像中的不同文本方向的文字仍然是一个具有挑战性的研究课题。

本研究以字符识别中的任意方向旋转的字符识别为目标,从字符的方向特征出发,致力于设计出能够快速准确识别出场景文本中多方向字符的系统。

2. 毕业设计(论文)主要任务及要求

(1)任意方向字符识别系统的设计与实现:

任意方向字符识别系统从场景图像文本定位和识别两个方向进行研究,在文本定位阶段,就能准确定位出文本所在区域为目标,设计出对文本内容和背景内容能有效分类的分类器。在文本识别阶段,就常见的方向特征展开分析,着力于设计出具有鲁棒性的文本方向描述子,具体需满足:位移不变、尺度不变、旋转不变、射影不变等条件。以此特征为基础开发出一套任意方向字符识别系统。

(2) 技术要求:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

2019年1月1日-2019年1月31日:阅读文献,主要是文本识别与定位和旋转特征提取相关的文献;

2019年2月1日-2019年2月28日:掌握技能,具有针对性的学习编程语言,算法,图像处理相关知识,尝试实现已阅读文献中的方法,完成开题报告;

2019年3月1日-2019年3月31日:设计新的具有鲁棒性的任意方向文本识别的文本定位分类器和方向特征描述方法,从理论和实验上进行验证;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] Sergry Z, Nikos K. Learning to compare image patches viaconvolutional neural networks. IEEE Conference on Computer Vision and PatternRecognition, 2015,pp.4353-4361

[2]Dmitry L, Nikolay S, Joachm M.B, Marc P. TI-POOLING:transformation -invariantpooling for feature learning in convolutional neural network. In: Proceedingsof the 2016 IEEE Conference on Computer Visionand Pattern Recognition. 2016. 289-297.

[3]Zhou Y, Ye Q, Qiu Q, Jiao J. Oriented response network. In Computer Vision andPattern Recognition, 2017.4961-4970.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。