1. 毕业设计(论文)主要目标:
对目前流行的视觉神经网络算法进行优化。传统目标检测使用滑动窗口来选择区域,由于这种方式没有针对性,对时间要求比较高,同时区域选择也存在冗余性。特征的提取方式比较固定,因此对于变化的对象鲁棒性有待提高。
R-CNN对图像进行了预处理,选择性地找出目标图像中目标候选区域,即目标可能出现的位置。通过滤波矩阵提取出目标图像中的纹理、颜色等其他图像信息,这样能够保证一定的召回率,同时也使得窗口数量大大减少,但是仍然高达上千。因此,为了提高图像特征的提取的速度,找出物体的候选区域/框,这些框之间是可以互相重叠互相包含的,这样本来需要枚举的所有框就变成选择一部分框,大大提高了运行速度。
传统方法使用穷举方法选择区域,R-CNN在第一步流程中,是对原始图片通过选择性提取算法提取的候选框,但是候选仍然多达2000个左右,并且这些候选框全部都需要进行特征提取和使用分类器进行分类,由此,会降低检测速度,它庞大的计算导致检测一张图都需要47s。
2. 毕业设计(论文)主要内容:
本文将对FASTER R-CNN进行优化,通过对输入图像事先进行预处理,以加快后续图像检测的速度。在图片背景已知的情况下,直接对除了背景部分进行提取,对比无行人情况下的背景特征图,在进行候选框特征提取的时候,能够减少前景背景判断次数。
在FATER R-CNN的RPN阶段,选取的候选框的选择量仍然不小,由于对每一个滑动窗口都会进行9个锚的判定,因为是特征图是卷积后得到的,这9个锚的范围几乎可以覆盖整张图的有效区域。在同一点处选取3种比例的9个锚,对目标检测有很大的重叠区域。这里提出一种算法不在同一点出进行9个锚的展开,而是增加除原始起点外相邻的两个点,分别处于原始点上侧以及右侧,每个点选择一种尺度。这样选择,一方面能减少目标检测的重叠区域加快检测时间,另一方面保证覆盖范围不会减少。
然后可以获得较为精确的行人位置,为了减少检测时间以达到实时检测的目的,在各式各样的行人中,大多是以大某一范围比例情况出现,比如坐轮椅或者行走,很少出现行人比例小于1:1或者大于4:1的情况,在这种比例下,可以认为人是属于躺着,需要将这类目标删去。为什么在回归之后才筛选,不在锚点时就直接只进行两种比例计算,这是因为,根据实验,这三种比例能够达到最好的检测效果,并且因为在回归之前计算出的是大致位置,对于一个目标行人,同样可能出现使用[1,4]检测出一部分的情况。
3. 主要参考文献
[1] 黄志杰,杨广柱.基于机器视觉的车辆行人检测系统技术综述[J].数字技术与应用,2017,22(2):115-116.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。