收藏本站 | 论文目录

关键词: python matlab plc 单片机 dsp fpga 仿真 stm32

当前位置: 毕业论文设计参考 >> 其它专业论文 >> 软件工程本科论文

基于MSER的场景文字检测方法研究

[关键词:MSER,场景文字,检测方法]  [热度 ]
提示:此毕业设计论文完整版包含【开题报告,任务书,论文,源程序
作品编号:rjgc0487,word全文:37页,合计:11000

以下仅为该作品极少介绍,详细内容请点击购买完整版!
基于MSER的场景文字检测方法研究毕业设计论文------

本文第一章首先介绍文字检测与文字识别技术发展现状,第二章对现阶段文字检测主流技术进行概述,分为两节内容,分别对候选区域提取和文字/非文字分类进行概述,第三章详细介绍场景文字检测方法的实现原理,第四章对该算法进行系统结果评测,第五章对全文进行总结。本文基本实现了基于MSER的场景文本检测算法,获得了初步的结果。虽然目前结果还有待提高,但本文的算法为后续进一步的深入研究提供了基础。

系统概述

图3.1为场景文字检测系统流程图。首先输入信息一张彩色的图像,将这张彩色图片进行颜色空间变换。由原来的RGB颜色空间的彩色图片变为灰度图以及HSV颜色空间的图片。然后分别在灰度图的灰度通道、HSV颜色空间中的Hue通道以及HSV颜色空间中的Saturation通道这三个通道的原图以及取反图上进行计算,三个通道的像素值都是0到255,取反图就是用255减去各个像素值所得到的图像。再对这六个图像进行单通道文字检测。

图3.2为单通道文字系统检测流程图。首先输入单通道图像,提取MSER作为候选文字区域,但候选文字区域中许多是非文字区域。再用浅层神经网络进行文字与非文字的分类,滤除非文字区域。接着进行后处理,找回被错分的成非文字的文字区域,最终得到单通道文本行。

最后再进行多通道文本行结果融合,最终得到文字区域。

结论

本节是对本文进行的总结,本文主要提到的两大模块是MSER区域提取,以及神经网络分类器,并从原理上进行分析实现,并在细节上提出了一些优化。如进行归一化操作时,本项目并非使用的是openCV封装好的函数,因为openCV封装的函数会将图像进行拉伸修改,本项目自己实现了一个归一化方法,使图片归一化时等比例放缩,不破坏原有形状。在神经网络分类器训练上,使用代码生成了一百多万个训练样本,在这么大规模的数据下这时间复杂度要求较高,并且还要防止内存泄漏等问题,对于我的大数据处理水平提高有显著的帮助。整个项目也自己写了几千行代码,对我的编码水平提升十分有益。

 

 


以上仅为该作品极少介绍,详细内容请点击购买完整版!

提示:此毕业设计论文完整版包含【开题报告,任务书,论文,源程序
作品编号:rjgc0487,word全文:37页,合计:11000

本软件工程毕业设计论文作品由 毕业论文设计参考 [http://www.qflunwen.com] 征集整理——基于MSER的场景文字检测方法研究(开题报告,任务书,论文,源程序)!