• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 8
    • 下载费用:30 金币  

    重庆时时彩特殊号技巧: 基于特征加权的朴素贝叶斯扫描证书图像分类方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201510100700.2

    申请日:

    2015.03.09

    公开号:

    CN104751171A

    公开日:

    2015.07.01

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06K 9/62申请日:20150309|||公开
    IPC分类号: G06K9/62 主分类号: G06K9/62
    申请人: 中南大学
    发明人: 龙军; 祝莉媛; 张昊; 刘献如
    地址: 410000湖南省长沙市岳麓区岳麓山左家垅
    优先权:
    专利代理机构: 长沙朕扬知识产权代理事务所(普通合伙)43213 代理人: 周志中
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201510100700.2

    授权公告号:

    ||||||

    法律状态公告日:

    2016.04.20|||2015.07.29|||2015.07.01

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明公开一种基于特征加权的朴素贝叶斯扫描证书图像分类方法,通过对经过预处理的证书图像利用Hough变换进行圆章定位、分割、大小调整,提取圆章区域的HSV空间的颜色特征向量及图像长宽比;建立证书图像数据库,对数据库中的每一幅证书图像按照上述步骤进行处理,得到数据库中每幅扫描证书图像的圆章HSV颜色特征向量及图像长宽比,根据得到的特征向量计算证书图像数据库中不同数据组合出现的概率,加权处理后保存数据;根据朴素贝叶斯算法及证书图像数据库中不同数据组合出现的概率计算待分类图像最有可能的图像类别,并且该概率满足设定的阈值要求的,判断图片的分类;本方法能简单快速地对证书图像分类,提高证书图像检索的效率。

    权利要求书

    权利要求书
    1.  一种基于特征加权的朴素贝叶斯扫描证书图像分类方法,其特征在于,包括如下步骤:
    步骤1:建立一个扫描证书图像不同数据组合的似然概率索引;
    步骤2:读取待分类扫描证书图像,进行预处理;
    步骤3:对经过预处理的证书图像利用Hough变换进行圆章定位,得到圆章外接矩形区域,提取圆章区域的HSV颜色特征向量;
    步骤4:对HSV颜色特征向量显著特征项进行加权;
    步骤5:计算并记录提取圆章区域的HSV颜色特征向量中不同数据组合出现的概率;
    步骤6:根据待分类图像的HSV颜色特征向量、每类扫描证书图像的先验概率及训练过程得到的扫描证书图像不同数据组合的似然概率索引,利用朴素贝叶斯算法计算待分类图像的分类情况,返回满足设定的阈值要求的扫描证书图像作为分类的结果。

    2.  根据权利要求1所述的基于特征加权的朴素贝叶斯扫描证书图像分类方法,其特征在于,步骤1建立扫描证书图像不同数据组合的似然概率索引是将证书图像数据库中的每一幅证书图像按照步骤2至5进行处理而获得的。

    3.  根据权利要求1所述的基于特征加权的朴素贝叶斯扫描证书图像分类方法,其特征在于,所述步骤2中预处理是利用现有噪声滤除和倾斜校正方法。

    4.  根据权利要求1所述的基于特征加权的朴素贝叶斯扫描证书图像分类方法,其特征在于,所述步骤3的具体操作步骤如下:
    1)利用现有圆章定位的方法,对定位得到的圆章所在的外接矩形进行分割提取,得到圆章区域;
    2)将色度H、饱和度S及亮度V三个分量分别非均匀量化为8份、4份和4份:
    H=0H∈[315,23]1H∈[24,50]2H∈[51,75]3H∈[76,155]4H∈[156,195]5H∈[196,275]6H∈[276,290]7H∈[290,316]]]>S=0S∈[0,0.08]1S∈(0.08,0.4]2S∈(0.4,0.67]3S∈(0.67,1.0]]]>V=0V∈[0,0.08]1V∈(0.08,0.4]2V∈(0.4,0.67]3V∈(0.67,1.0];]]>
    这样圆章区域的HSV空间被分成LH+LS+LV个区间,LH、LS、LV分别是H、S及V的量化级数,得到一个十六维的颜色特征向量,加上扫描图像图片长宽比,最终提取一个十七维特征向量;
    3)提取的十七维特征用(Lk0,Lk1...Lk16)表示,取值范围为[0,9]之间的整数。

    5.  根据权利要求1所述的基于特征加权的朴素贝叶斯扫描证书图像分类方法,其特征在于,所述步骤4对特征向量显著特征项进行加权的具体操作步骤为:采用标准差来衡量图像特征权重,wi={wko,wk1...wk16}表示特征向量的权重,样本集中类别为j的第i维的标准差σi,其计算公式为:
    σi=Σk=1nj(Lki-xi‾)/(nj-1)]]>
    nj为j类样本数,Lki为图像类别为j的第k个样本的第i维特征值,为该维特征的平均值,用ei表示特征重要性,ei∈[0,1]为公式:从而得到每个样本每维特征加权的计算方法为:wki=ei/Σi=016ei.]]>

    6.  根据权利要求1所述的基于特征加权的朴素贝叶斯扫描证书图像分类方法,其特征在于,所述步骤5计算并记录提取圆章区域的特征向量中不同数据组合出现的概率的具体操作步骤为:统计特征向量中不同数据出现的概率;得到的概率值乘以步骤4中计算出的权重,作为不同数据组合出现的概率保存。

    7.  根据权利要求1所述的基于特征加权的朴素贝叶斯扫描证书图像分类方法,其特征在于,所述步骤6具体为:根据步骤5中得到的不同数据组合出现的概率和朴素贝叶斯算法,计算待分类证书图像为每类图像的概率;得到证书为每一类的概率,并且最大值大于阈值,则判断证书为概率最大的类别,阈值设定为0.048。

    说明书

    说明书基于特征加权的朴素贝叶斯扫描证书图像分类方法
    技术领域
    本发明涉及一种图像分类方法,特别涉及的是一种扫描证书图像分类方法。
    背景技术
    最近几年来,图像检索是一个非常受欢迎的话题,其检索对象包括海里游的,在天空中飞翔的及地上走的。图像分类是图像检索的一个预处理过程,可以有效提高图像检索的准确性。尽管已有针对不同种类图像数据集的众多图像分类检索系统,但是扫描证书图像分类检索方面则关注较少,而这些扫描证书图像往往是申请奖励或公司拓展的重要辅助材料。为了保证这类证书图像的合法利用,避免同张证书被多次利用,在特殊的扫描证书数据集里的扫描图像查重对于某些检索系统是非常重要的,这有点类似于文件的相似性检查。目前适用于比较流行的基于内容的图像分类检索系统的图像特征有颜色、纹理、形状以及空间位置关系,但扫描证书图像质量低,种类繁多,版面形式多样,既包含具有特定意义的图像标志,同时又包含对于获奖情况的简明扼要描述,因此,仅仅利用现有算法要实现从海量图像库中查找是否存在与待测证书相似的图像文件是有困难的。因此,我们就得具体分析扫描图像的特征,选取能更好地表述证书图像特点的特征。如何借助计算机技术快速准确对附件证明材料—扫描图像--进行相似性检测是国家科学技术奖励评审迫切需要解决的问题。
    发明内容
    本发明提供一种扫描证书图像分类方法,能对证书图像进行快速有效的分类,并可以显著提高证书图像检索的准确率。
    为实现上述目的,本发明的技术方案如下:
    一种基于特征加权的朴素贝叶斯扫描证书图像分类方法,包括如下步骤:
    步骤1:建立一个扫描证书图像不同数据组合的似然概率索引;
    步骤2:读取待分类扫描证书图像,进行预处理;
    步骤3:对经过预处理的证书图像利用Hough变换进行圆章定位,得到圆章外接矩形区域,提取圆章区域的HSV颜色特征向量;
    步骤4:对HSV颜色特征向量显著特征项进行加权;
    步骤5:计算并记录提取圆章区域的HSV颜色特征向量中不同数据组合出现的概率;
    步骤6:根据待分类图像的HSV颜色特征向量、每类扫描证书图像的先验概率及训练过程得到的扫描证书图像不同数据组合的似然概率索引,利用朴素贝叶斯算法计算待分类图像的分类情况,返回满足设定的阈值要求的扫描证书图像作为分类的结果。本发明的有益效果是:本发明基于特征加权的朴素贝叶斯扫描证书图像分类方法,通过对经过预处理的证书图 像利用Hough变换进行圆章定位、分割、大小调整,提取圆章区域的HSV空间的颜色特征向量及图像长宽比;建立证书图像数据库,对数据库中的每一幅证书图像按照上述步骤进行处理,得到数据库中每幅扫描证书图像的圆章HSV颜色特征向量及图像长宽比,根据得到的特征向量计算证书图像数据库中不同数据组合出现的概率,加权处理后保存数据;根据朴素贝叶斯算法及证书图像数据库中不同数据组合出现的概率计算待分类图像最有可能的图像类别,并且该概率满足设定的阈值要求的,判断图片的分类;通过本分类方法,能简单快速地对证书图像进行分类,有效提高证书图像检索的效率。
    附图说明
    图1为本发明实施例图像分类方法的流程图。
    具体实施方式
    下面结合附图及实例,对本发明做进一步说明。
    参见图1,本实施例基于特征加权的朴素贝叶斯扫描证书图像分类方法含有以下步骤:一种基于特征加权的朴素贝叶斯扫描证书图像分类方法,包括如下步骤:
    A:输入待分类扫描证书图像,进行预处理;
    B:对经过预处理的证书图像利用Hough变换进行圆章定位,得到圆章外接矩形区域,提取圆章区域的HSV颜色特征向量;
    C:对HSV颜色特征向量显著特征项进行加权;
    D:计算并记录提取圆章区域的HSV颜色特征向量中不同数据组合出现的概率;
    证书图像数据库中的每一幅证书图像按照上述步骤A~D进行处理,计算并记录数据库中每类扫描证书图像的先验概率和提取圆章区域的HSV颜色特征向量中不同数据组合出现的概率,即建立一个扫描证书图像不同数据组合的似然概率索引;
    E:根据待分类图像的HSV颜色特征向量、每类扫描证书图像的先验概率及训练过程得到的扫描证书图像不同数据组合的似然概率索引,利用朴素贝叶斯算法计算待分类图像的分类情况,返回满足设定的阈值要求的扫描证书图像作为分类的结果;
    本方法利用的朴素贝叶斯算法如下:
    vNB=argmaxP(vj)ΠiP(ai|vj)]]>
    P(vj|Lk)=P(vj)ΠiP(Li|vj)]]>
    本分类方法的目标是在根据待分类图像的圆章特征向量得到证书图像最可能的类别,P(vj)是先验概率,只要计算每个类别出现在证书图像数据库的频率就可以。vNB表示朴素贝叶斯分类器输出的目标值。概括的讲,基于它们在训练数据上的概率,朴素贝叶斯学习方法 需要估计不同的P(vj)和P(ai|vj)项,这些估计对应了待学习的假设,然后使用朴素贝叶斯提出的规则来分类。我们使用的朴素贝叶斯算法同其他的分类算法不同之处就在于只需要简单地计算训练样例中不同数据组合的出现频率就可以,不需要搜索。
    (Lk0,Lk1...Lk16)是待查询图像的圆章区域的HSV颜色特征向量及图片长宽比,(Li0,Li2...Li16)是数据库中扫描证书图像的圆章区域的HSV颜色特征向量及图片长宽比。
    所述步骤A中预处理是利用现有噪声滤除和倾斜校正方法进行预处理;
    在所述步骤B中对经过预处理的证书图像利用现有圆章定位的方法,对定位得到的圆章所在的外接矩形进行分割提取,得到圆章区域,提取圆章区域的HSV颜色特征向量;
    具体操作步骤如下:
    1)利用现有圆章定位的方法,对定位得到的圆章所在的外接矩形进行分割提取,得到圆章区域;
    2)将色度H、饱和度S及亮度V三个分量分别非均匀量化为8份、4份和4份:
    H=0H∈[315,23]1H∈[24,50]2H∈[51,75]3H∈[76,155]4H∈[156,195]5H∈[196,275]6H∈[276,290]7H∈[290,316]S=0S∈[0,0.08]1S∈(0.08,0.4]2S∈(0.4,0.67]3S∈(0.67,1.0]V=0V∈[0,0.08]1V∈(0.08,0.4]2V∈(0.4,0.67]3V∈(0.67,1.0];]]>
    这样圆章区域的HSV空间被分成LH+LS+LV个区间,LH、LS、LV分别是H、S及V的量化级数,于是我们得到一个十六维的颜色特征向量,加上扫描图像图片长宽比,最终提取一个十七维特征向量;
    3)朴素贝叶斯方法是对出现的每一个数据进行统计,统计其出现的频率。为了便于计算,经过反复试验,对所有特征值提取一位数的整数能得到最好的效果。本方法选取的十七维特征用(Lk0,Lk1...Lk16)表示,取值范围为[0,9]之间的整数。
    所述步骤C中对特征向量显著特征项进行加权。
    图像特征分布具有这样的特性:在同一个图像类别中,如果某个特征的统计分布比较密集,离散程度比较小,那么这个特征相对与这个类别是起支配作用的,是一个重要的特征。相反,如果某个特征统计比较分散,离散程度比较高,就是一个不重要的特征。数据的标准差可以很好地描述数据的离散情况。本方法采用标准差来衡量图像特征权重。 wi={wko,wk1...wk16}表示特征向量的权重。样本集中类别为j的第i维的标准差σi,其计算公式为:
    σi=Σk=1nj(Lki-xi‾)/(nj-1)]]>
    nj为j类样本数,Lki为图像类别为j的第k个样本的第i维特征值,为该维特征的平均值。用ei表示特征重要性,ei∈[0,1]为公式:从而得到每个样本每维特征加权的计算方法为:wki=ei/Σi=016ei.]]>
    其中,计算并记录提取圆章区域的特征向量中不同数据组合出现的概率,其具体操作步骤如下:
    1)统计特征向量中不同数据出现的概率,例如第1类第2维出现4的概率为30%;
    2)得到的概率值乘以步骤C中计算出的权重,作为不同数据组合出现的概率保存。
    基于特征加权的朴素贝叶斯扫描证书图像分类方法,其具体操作步骤如下:
    1)根据步骤D中得到的不同数据组合出现的概率和朴素贝叶斯算法,计算待分类证书图像为每类图像的概率。例如假定A图像为第1类图像,第2维出现数字4,在步骤D保存的概率中找到对应的概率值,将所有出现的数据组合根据步骤D的概率查找并计算出来;
    2)得到证书为每一类的概率,并且最大值大于阈值,则判断证书为概率最大的类别。阈值设定为0.048。
    本实施例扫描证书图像分类结果如下表。
     测试图片数分类正确张数分类错误张数准确率一类软件著作权扫描证书图像10100100%二类软件著作权扫描证书图像10100100%专利扫描证书图像10100100%其他干扰图像109190%

    关 键 词:
    基于 特征 加权 朴素 贝叶斯 扫描 证书 图像 分类 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:基于特征加权的朴素贝叶斯扫描证书图像分类方法.pdf
    链接地址://www.4mum.com.cn/p-5894585.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03