复杂场景下基于CTPN的离线文本快速检测技术研究任务书

 2022-01-09 20:30:07

全文总字数:1371字

1. 毕业设计(论文)主要内容:

复杂场景,主要是指自然场景下情况比较复杂,例如像街边的广告牌、产品包装盒、设备上的说明、商标等等,存在着背景复杂、光线忽明忽暗、角度倾斜、扭曲变形、清晰度不足等各种情况。

要求利用CTPN(Connectionist Text Proposal Network:基于连接预选框网络的文本检测)技术对图片中的文本行进行准确定位,在卷积获得的特征图上生成的一系列适当尺寸的文本预选框,进行文本行的检测。

可根据个人熟悉情况用Matlab、Python或者C 进行开发。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

(1) 查阅不少于15篇的近5年相关资料,其中外文文献不少于3篇,完成开题报告(设计目的意义至少800汉字,基本内容和技术方案至少400汉字)。

(2) 利用CTPN(Connectionist Text Proposal Network:基于连接预选框网络的文本检测)算法,对图片中的文本行进行准确定位,并编写程序实现。

(3) 所设计完成的程序应具有较高的可操作性与较好的用户体验,程序应运行稳定。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

第1周—第3周搜集资料,撰写开题报告;第4周—第5周论文开题;第6周—第12周撰写论文初稿;第12周—第15周修改论文;第16周论文答辩。

4. 主要参考文献

1、张再银, 童立靖, 湛健. 基于文本域分割和文本行检测的扭曲文档图像校正[J]. 电脑与信息技术, 2015, 23(1).2、李景, 金花, 刘金刚. 一种基于英文字符的斜体检测方法[J]. 计算机应用与软件, 2015(3):192-195.3、熊玲. 自然场景图像中的文本定位和提取算法研究[D]. 东南大学, 2016.4、Asma Naseer, Kashif Zafar. Meta features-based scale invariant OCR decision making using LSTM-RNN[J]. Computational Mathematical Organization Theory, 2019, 25.5、Elena Limonova, Pavel Bezmaternykh, Dmitry Nikolaev,等. Slant rectification in Russian passport OCR system using fast Hough transform[C]// Ninth International Conference on Machine Vision. Society of Photo-Optical Instrumentation Engineers (SPIE) Conference Series, 2017.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。