• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 12
    • 下载费用:30 金币  

    重庆时时彩是否骗局: 一种在线手写中日文的识别方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201610898064.7

    申请日:

    2016.10.14

    公开号:

    CN106570458A

    公开日:

    2017.04.19

    当前法律状态:

    公开

    有效性:

    审中

    法律详情: 公开
    IPC分类号: G06K9/00 主分类号: G06K9/00
    申请人: 上海新同惠自动化系统有限公司
    发明人: 刘建生
    地址: 201500 上海市金山区朱泾镇松枫公路350号769室B座
    优先权:
    专利代理机构: 上海集信知识产权代理有限公司 31254 代理人: 洪玲
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201610898064.7

    授权公告号:

    法律状态公告日:

    2017.04.19

    法律状态类型:

    公开

    摘要

    本发明提供一种在线手写中日文识别方法。通过应用结构化字典表示(structured?dictionary?representation)和矢量量化(VQ)技术建立一种紧凑型的基于MRF在线字符识别方法,实现对大规模中日文字符集的识别。本发明将字符分解为组成字符的基本要素自由基,通过基于MRF的模型将组成不同字符的相同的自由基进行共享,节省了字典模型的存储空间。此外,本发明同时应用了VQ技术压缩字符识别器,可以在不损失识别率的同时,进一步大幅压缩字典模型的存储空间。

    权利要求书

    1.一种在线手写中日文识别方法,其特征在于按照如下步骤实现:
    步骤S1:字符识别,首先把输入的手写体文字在保存原输入文字的水平和垂直比率不
    变情况下进行线性正规化处理,转化成标准大小的文字,然后重新抽取特征点。对于输入文
    字的每一条边,首先将该边的起始点和终止点选为特征点;其次,如果该边上除了已经选为
    特征点外的某一点到相邻特征点的距离大于某一阈值,则该点也被选为特征点.这样一直
    选择特征点直到没有别的特征点可选为止;
    步骤S2:采用MRF模型作为在线识别器的识别函数。通过比较输入文字的特征点与原型
    字典中各类原型的状态,得到输入文字与各类原型的相似度,具有最大相似度的文字类作
    为输入手写体文字的识别结果,得到一个字符级别的MRF识别器;
    步骤S3:构建结构化MRF识别器,进一步地,创建一个接口来构建结构化的MRF,得到一
    元特征均值向量:训练模型的特征点的平均坐标。每个字符所有笔画连接到一个笔画以得
    到笔画数独立性。在特征点上单击鼠标右键切入特征点的字符(character)模式。一个鼠标
    左键点击,将在特征点连接两个自由基(radical)。通过此方法可将字符模型分为几部分。
    通过分解归一化处理将每一部分登记在自由基字典中,同时可以将相同的自由基归为同一
    类;
    步骤S4:将所有字符MRF模型分解登记,使训练模型与字符MRF同步分解到自由基水平。
    从自由基训练模型的包围盒中得到均值包围盒(mean bounding box)。不同字符中分解出
    来的自由基可能有不同的大小和位置,将这些自由基归一化,然后用归一化的自由基模型
    训练自由基MRF模型。通过归一化均值向量和协方差矩阵的均值包围盒,我们设置自由基
    MRF模型为字符模型;
    步骤S5:聚类不同大小和位置的每一个自由基。每一个自由基MRF来自不同字符类中的
    自由基模式,因而大小位置不同。聚集不同尺寸的每个自由基为不同组别,分离自由基为多
    个类别。最优化分组数量;
    步骤S6:通过VQ技术对字典进行压缩,在MRF识别器中,存在众多相同一元和二元特征。
    对于一元和二元特征,每一个均值向量有两个参数元素,每一个协方差矩阵有四个参数元
    素每个状态有三个转移概率即有三个参数元素。将一元和二元特征的均值向量和协方差矩
    阵参数元素作为一个组合。表示每个状态的三个转移概率的三个参数元素设为另一个组
    合。将参数组合聚类为不同组,将共享相同参数集的组设为组中心。通过存储组索引和中心
    参数,对识别器进行压缩。
    2.根据权利要求1所述的一种在线手写中日文识别方法,其特征在于,在所述步骤S1字
    符识别过程中,采用Ramner方法。
    3.根据权利要求1所述的一种在线手写中日文识别方法,其特征在于,所述步骤S2构建
    MRF识别器的方法为:设置特征点从一个输入模集合S={s1,s2,s3,…,sI}。特征点从一个输
    入模式集合S={s1,s2,s3,…,sI}。该识别函数通过比较输入文字的特征点与原型字典中各
    类原型的状态,得到输入文字与各类原型的相似度,具有最大相似度的文字类作为输入手
    写体文字的识别结果。
    邻域系统是根据书写顺序选取连续临近特征点,设置
    单数集合:c1={s1,s2,s3,…,s10,…}
    配对集合:c2={{s1,s2},{s2,s3},{s3,s4},{s4,s5},……,{s9,s10},…}
    给每个字符类定义一个线性链MRF,每个标签有一个状态,每一个状态有三个变换。
    状态转化概率在MAP框架中,最大的后验概率等同于最小的能量函数。
    能量函数
    <mrow> <mtable> <mtr> <mtd> <mrow> <mi>E</mi> <mrow> <mo>(</mo> <mi>O</mi> <mo>,</mo> <mi>F</mi> <mo>|</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>E</mi> <mrow> <mo>(</mo> <mi>O</mi> <mo>|</mo> <mi>F</mi> <mo>,</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>E</mi> <mrow> <mo>(</mo> <mi>F</mi> <mo>|</mo> <mi>C</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>I</mi> </munderover> <mo>&lsqb;</mo> <mo>-</mo> <mi>log</mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>O</mi> <msub> <mi>s</mi> <mi>i</mi> </msub> </msub> <mo>|</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mi>i</mi> </msub> </msub> <mo>,</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>log</mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>O</mi> <mrow> <msub> <mi>s</mi> <mi>i</mi> </msub> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </msub> <mo>|</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mi>i</mi> </msub> </msub> <mo>,</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </msub> <mo>,</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>log</mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mi>i</mi> </msub> </msub> <mo>|</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </msub> <mo>,</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
    其中:一类分配标签si
    :一元特征,包括X和Y坐标点
    :具有双元素的二进制特征(dx:X coordinate of si-X coordinate of si-1,dy:Y
    coordinate of si-Y coordinate of si-1)
    高斯函数用来评估条件概率
    <mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>O</mi> <msub> <mi>s</mi> <mi>i</mi> </msub> </msub> <mo>|</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mi>i</mi> </msub> </msub> <mo>,</mo> <mi>C</mi> <mo>)</mo> </mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>O</mi> <mrow> <msub> <mi>s</mi> <mi>i</mi> </msub> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </msub> <mo>|</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mi>i</mi> </msub> </msub> <mo>,</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </msub> <mo>,</mo> <mi>C</mi> <mo>)</mo> </mrow> </mrow>
    状态转移概率:
    <mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mi>i</mi> </msub> </msub> <mo>|</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </msub> <mo>,</mo> <mi>C</mi> <mo>)</mo> </mrow> </mrow>
    <mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mi>i</mi> </msub> </msub> <mo>|</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </msub> <mo>,</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>N</mi> <mi>u</mi> <mi>m</mi> <mi>b</mi> <mi>e</mi> <mi>r</mi> <mi> </mi> <mi>o</mi> <mi>f</mi> <mi> </mi> <mi>t</mi> <mi>r</mi> <mi>a</mi> <mi>n</mi> <mi>s</mi> <mi>i</mi> <mi>t</mi> <mi>i</mi> <mi>o</mi> <mi>n</mi> <mi>s</mi> <mi> </mi> <mi>f</mi> <mi>r</mi> <mi>o</mi> <mi>m</mi> <mi> </mi> <msub> <mi>l</mi> <mrow> <msub> <mi>s</mi> <mi>i</mi> </msub> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mi>t</mi> <mi>o</mi> <mi> </mi> <msub> <mi>l</mi> <msub> <mi>s</mi> <mi>i</mi> </msub> </msub> </mrow> <mrow> <mi>N</mi> <mi>u</mi> <mi>m</mi> <mi>b</mi> <mi>e</mi> <mi>r</mi> <mi> </mi> <mi>o</mi> <mi>f</mi> <mi> </mi> <mi>s</mi> <mi>i</mi> <mi>t</mi> <mi>e</mi> <mi>s</mi> <mi> </mi> <mi>a</mi> <mi>s</mi> <mi>s</mi> <mi>i</mi> <mi>g</mi> <mi>n</mi> <mi>e</mi> <mi>d</mi> <mi> </mi> <msub> <mi>l</mi> <mrow> <msub> <mi>s</mi> <mi>i</mi> </msub> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </mfrac> </mrow>
    <mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mn>1</mn> </msub> </msub> <mo>|</mo> <msub> <mi>l</mi> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </msub> <mo>,</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>N</mi> <mi>u</mi> <mi>m</mi> <mi>b</mi> <mi>e</mi> <mi>r</mi> <mi> </mi> <mi>o</mi> <mi>f</mi> <mi> </mi> <msub> <mi>s</mi> <mn>1</mn> </msub> <mi> </mi> <mi>a</mi> <mi>s</mi> <mi>s</mi> <mi>i</mi> <mi>g</mi> <mi>n</mi> <mi>e</mi> <mi>d</mi> <mi> </mi> <msub> <mi>l</mi> <msub> <mi>s</mi> <mn>1</mn> </msub> </msub> </mrow> <mrow> <mi>N</mi> <mi>u</mi> <mi>m</mi> <mi>b</mi> <mi>e</mi> <mi>r</mi> <mi> </mi> <mi>o</mi> <mi>f</mi> <mi> </mi> <msub> <mi>s</mi> <mn>1</mn> </msub> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
    每个字符类有一个直链MRF,我们使用维特比搜索匹配特征点的输入模式与MRF的每个
    字符类的状态,为每个字符类找到匹配的路径和最小能量。
    4.根据权利要求1所述的一种在线手写中日文识别方法,其特征在于,在所述步骤S5,
    聚类不同大小和位置的每一个自由基时,应用均集群分析方法聚集不同尺寸的每个自由基
    为不同组别,分离自由基为多个类别,最优化分组数量。
    5.根据权利要求1所述的一种在线手写中日文识别方法,其特征在于,字符型识别器通
    过在线日文手写数据库Nakayosi训练。
    6.根据权利要求1所述的一种在线手写中日文识别方法,其特征在于,性能测试使用在
    线日文手写数据库Kuchibue。

    说明书

    一种在线手写中日文的识别方法

    技术领域

    本发明涉及字符识别技术领域,尤其涉及一种在线手写中日文识别方法。

    背景技术

    在线手写字符识别过程中,当用户使用手写笔在一个专用的笔记本或平板电脑上
    书写时,有一个传感器识别笔尖的移动和抬笔/落笔的转换。此数据被称为“数字墨水”,可
    以被视为一个手写过程的动态表现。在线手写字符识别是一种将数字墨水自动转换为计算
    机可编辑和检索的代码的技术。由于平板电脑、电子白板、智能手机和iPad等这些拥有触控
    交互界面和表面的电子设备的出现,使得在线手写字符识别的应用更加广泛。因此,人们需
    求手写字符串模式识别(字符书写时有较少的限制)技术,而不是独立的字符识别(每个字
    符要求写入指定的格子中)。连续手写字符串模式是一种草书风格,导致了在字符识别过程
    中分割字符的难度。正因为这个原因,需要一个能够提供自然的更加方便用户输入的高性
    能手写字符串识别方法。

    由于中文、日文和韩文有数以千计的不同类别和庞大的字符集,现有手写识别方
    法在识别率、识别速度和内存消耗方面都存在问题。目前用于识别7097个日文字符的基于
    马尔科夫随机场(MRF)的识别方法需要20兆字节的内存消耗,如果MRF识别方法结合非结构
    的改进二次函数(MQDF)和语境处理的识别方法,由于MQDF字典和语境字典的大体积,其需
    要更大体积的内存(约65兆字节)。所以,市场上急需高速低内存消耗的??榛中词侗鸱?br />法。每页识别速度在0.5秒以内,内存消耗在10兆字节的手写识别方法拥有实际应用价值。

    发明内容

    本发明的目的在于提供一种高性能的在线手写中日文识别器方法,所述方法具有
    较高识别率和识别速度,同时具有较小的内存消耗。

    为解决上述技术问题,本发明公开了一种应用于中日文大字符集的紧凑型的基于
    MRF在线字符识别方法,其中应用了结构化字典表示和矢量量化(VQ)技术。

    基于MRF的手写体文字识别在线识别器的构建。在线单文字在识别过程中用抽取
    的特征点序列替代文字输入时采集的笔尖落点坐标序列,不仅能够更加高效地表达该手写
    体文字,而且能降低文字识别过程中因特征点过多而导致的计算资源消耗.首先把输入的
    手写体文字在保存原输入文字的水平和垂直比率不变情况下进行线性正规化处理,转化成
    标准大小的文字,然后重新抽取特征点。对于输入单文字的每一条边,首先将该边的起始点
    和终止点选为特征点;其次,如果该边上除了已经选为特征点外的某一点到相邻特征点的
    距离大于某一阈值,则该点也被选为特征点.这样一直选择特征点直到没有别的特征点可
    选为止。

    采用MRF模型作为在线识别器的识别函数。该识别函数通过比较输入文字的特征
    点与原型字典中各类原型的状态,得到输入文字与各类原型的相似度,具有最大相似度的
    文字类作为输入手写体文字的识别结果。

    应用结构化字典表示技术减少内存消耗。中日文表意文字,在日本称为Kanji,具
    有系统和层次结构。自由基是常用的基本语义或语音单位进而构建成表意文字。每个中日
    文的表意文字含有一个或几个自由基。通过一套合理的自由基,能够表示所有的中日文表
    意文字。使用自由基的模型代替整体的文字模型可以很大程度上减少模型的数量。

    应用VQ技术压缩字符识别器,本发明所述的MRF识别器中,由于字符和自由基的一
    元和二元特性有许多类似的顺序。因此,可以将同样的方法应用于每个平均向量的参数、每
    个一元特性和二元特征的协方差矩阵和每个状态的转移概率,集群参数序列分成小组,各
    个小组共享一个共同的参数序列。它可以使压缩更加有效。

    本发明公开了一个在线日文识别方法,应用结构化字典表示技术和VQ技术,在保
    持识别精度的同时进一步压缩了内存空间。增加了广泛的实验结果,字符类的数目从2965
    个增加到4218个(日常生活常用的字符集)。提出了构造多个MRF模型类来改善识别性能的
    方法。本发明中针对不同实际需求,构造了多个MRF模型。结构化MRFs与VQ技术结合,在保证
    识别率的同时可以减少16%的内存,但是处理时间增加2倍。原始MRF模型与VQ2技术的组合
    则可以节省时间。综合考虑,结构化的MRFs结合VQ技术更能满足实际需求。

    附图说明

    为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使
    用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于
    本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它
    的附图。

    图1为本发明中在线手写中日文识别器方法的流程图

    图2为特征点抽取过程示意图。

    图3为MRF标记示意图。

    图4为线性链MRF示意图。

    图5为创建一个接口来构建结构化的MRF的示意图。

    图6为自由基模式归一化示意图。

    图7为通过VQ聚集参数示意图。

    图8为字符模式的数据库统计。

    图9为三种模型的识别率、内存消耗和识别速度的比较。

    图10为四种模型的识别率、内存消耗和识别速度的比较。

    具体实施方式

    下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明
    而不用于限制本发明的范围。

    本发明提供一种高性能的在线手写中日文识别器方法,如图1所示,按照如下步骤
    实现:

    步骤S1:字符识别,首先把输入的手写体文字在保存原输入文字的水平和垂直比
    率不变情况下进行线性正规化处理,转化成标准大小的文字,然后重新抽取特征点。对于输
    入文字的每一条边,首先将该边的起始点和终止点选为特征点;其次,如果该边上除了已经
    选为特征点外的某一点到相邻特征点的距离大于某一阈值,则该点也被选为特征点.这样
    一直选择特征点直到没有别的特征点可选为止;

    步骤S2:采用MRF模型作为在线识别器的识别函数。通过比较输入文字的特征点与
    原型字典中各类原型的状态,得到输入文字与各类原型的相似度,具有最大相似度的文字
    类作为输入手写体文字的识别结果,得到一个字符级别的MRF识别器;

    步骤S3:构建结构化MRF识别器,进一步地,创建一个接口来构建结构化的MRF,得
    到一元特征均值向量:训练模型的特征点的平均坐标。每个字符所有笔画连接到一个笔画
    以得到笔画数独立性。在特征点上单击鼠标右键切入特征点的字符模式。一个鼠标左键点
    击,将在特征点连接两个自由基。通过此方法可将字符模型分为几部分。通过分解归一化处
    理将每一部分登记在自由基字典中,同时可以将相同的自由基归为同一类。

    步骤S4:将所有字符MRF模型分解登记,使训练模型与字符MRF同步分解到自由基
    水平。从自由基训练模型的包围盒中得到均值包围盒。不同字符中分解出来的自由基可能
    有不同的大小和位置,将这些自由基归一化,然后用归一化的自由基模型训练自由基MRF模
    型。通过归一化均值向量和协方差矩阵的均值包围盒,我们设置自由基MRF模型为字符模
    型。

    步骤S5:聚类不同大小和位置的每一个自由基。每一个自由基MRF来自不同字符类
    中的自由基模式,因而大小位置不同。不同的大小带来不同的方差,如果将差别大的自由基
    MRF合并可能导致较低的识别性能。聚集不同尺寸的每个自由基为不同组别,分离自由基为
    多个类别。最优化分组数量。

    步骤S6:通过VQ技术对字典进行压缩,在MRF识别器中,存在众多相同一元和二元
    特征。对于一元和二元特征,每一个均值向量有两个参数元素,每一个协方差矩阵有四个参
    数元素每个状态有三个转移概率即有三个参数元素。将一元和二元特征的均值向量和协方
    差矩阵参数元素作为一个组合。每个状态的三个转移概率即有三个参数元素设为另一个组
    合。将参数组合聚类为不同组,将共享相同参数集的组设为组中心。通过存储组索引和中心
    参数,可以对识别器进行有效的压缩。

    具体实施方式为:

    1)建立一个紧凑的在线MRF识别器

    首先把输入的手写体文字在保存原输入文字的水平和垂直比率不变情况下进行
    线性正规化处理,转化成标准大小的文字,然后重新抽取特征点。对于输入单文字的每一条
    边,首先将该边的起始点和终止点选为特征点;其次,如果该边上除了已经选为特征点外的
    某一点到相邻特征点的距离大于某一阈值,则该点也被选为特征点.这样一直选择特征点
    直到没有别的特征点可选为止。如附图2所示,如a、b中的圆点为特征点。采用MRF模型作为
    在线识别器的识别函数。设置特征点从一个输入模集合S={s1,s2,s3,…,sI}。特征点从一
    个输入模式集合S={s1,s2,s3,…,sI}。该识别函数通过比较输入文字的特征点与原型字典
    中各类原型的状态,得到输入文字与各类原型的相似度,具有最大相似度的文字类作为输
    入手写体文字的识别结果。如图3所示。

    邻域系统是根据书写顺序选取连续临近特征点,设置

    单数集合:c1={s1,s2,s3,…,s10,…}

    配对集合:c2={{s1,s2},{s2,s3},{s3,s4},{s4,s5},……,{s9,s10},…}

    给每个字符类定义一个线性链MRF,如图4所示,每个标签有一个状态,每一个状态
    有三个变换。

    状态转化概率在MAP框架中,最大的后验概率等同于最小的能量函数。

    能量函数


    其中:一类分配标签si

    :一元特征,包括X和Y坐标点

    :具有双元素的二进制特征(dx:X coordinate of si-X coordinate of si-1,dy:
    Y coordinate of si-Y coordinate of si-1)

    高斯函数用来评估条件概率


    状态转移概率:



    每个字符类有一个直链MRF,我们使用维特比搜索匹配特征点的输入模式与MRF的
    每个字符类的状态,为每个字符类找到匹配的路径和最小能量。

    2)构建结构化MRF识别器

    首先创建一个字符级别的MRF识别器。进一步地,创建一个接口来构建结构化的
    MRF,得到一元特征均值向量:训练模型的特征点的平均坐标。每一个小的红色长方形:特征
    点坐标。如图5所示字符(娃)的均值坐标。每一个小的红色矩形显示了一个特征点。

    每个字符所有笔画连接到一个笔画以得到笔画数独立性。在特征点上单击鼠标右
    键切入特征点的字符模式。一个鼠标左键点击,将在特征点连接两个自由基。通过此方法可
    将字符模型分为几部分。通过分解归一化处理将每一部分登记在自由基字典中,同时可以
    将相同的自由基归为同一类。

    将所有字符MRF模型分解登记,我们将训练模型与字符MRF同步分解到自由基水
    平。从自由基训练模型的包围盒中得到平均包围盒。不同字符中分解出来的自由基可能有
    不同的大小和位置,将这些自由基归一化。通过均值包围盒将相同字符类中的出现的自由
    基归一化。如图6所示,橙色表示输入自由基模式。将自由基模式切出后,通过均值包围盒归
    一化,然后用归一化的自由基模型训练自由基MRF模型。通过归一化均值向量和协方差矩阵
    的均值包围盒,我们设置自由基MRF模型为字符模型。

    3)聚类不同大小和位置的每一个自由基。

    每一个自由基()MRF来自不同字符类中的自由基模式,因而大小位置不同。不同的
    大小带来不同的方差,如果将差别大的自由基MRF合并可能导致较低的识别性能。因而应用
    均集群分析方法来聚集不同尺寸的每个自由基,分离自由基为多个类别,最优化分组数量。

    4)通过VQ技术压缩

    如图7所示,在MRF识别器中,存在众多相同一元和二元特征。对于一元和二元特
    征,每一个均值向量有两个参数元素,每一个协方差矩阵有四个参数元素每个状态有三个
    转移概率即有三个参数元素。将一元和二元特征的均值向量和协方差矩阵参数元素作为一
    个组合。表示每个状态的三个转移概率的三个参数元素设为另一个组合。将参数组合聚类
    为不同组,将共享相同参数集的组设为组中心。存储将组索引和中心参数。对识别器进行压
    缩。上述组合方式相较于将均值向量、协方差矩阵和状态转移概率分别设为一组,对识别器
    的压缩效果更好。

    5)训练测试

    通过2965个汉字字符(日本工业标准1级)识别来评价紧凑型识别器,字符型识别
    器通过在线日文手写数据库Nakayosi训练。性能测试使用在线日文手写数据库Kuchibue。
    字符模型的数据库统计数据见图8。

    比较了三种模型的性能,分别是原始MRF模型、结构化MRF模型(Str-MRF1)和本发
    明的模型Str-MRF2,。运行环境为英特尔至强处理器(R)=3.36GHz的CPU w5590双核12GB内
    存。对比结果如图9所示,其中速度表示识别一个字符的平均时间。尽管Str-MRF1压缩存储
    空间很大,但很大程度上降低了字符识别的准确率。Str-MRF2比Str-MRF1拥有更好的识别
    精度,在保证识别速度的同时也压缩了存储空间。

    6)对比了VQ技术压缩后识别器的性能。

    Original MRF:使用4个字节的数据存储每个参数的状态转移概率和协方差矩阵,
    并使用2个字节的数据存储的平均向量的每个参数。

    VQ1:将参数集分成255组,并将每个组索引保存为1字节的数据。

    VQ2:将参数集分成若干组,并将每个组索引保存为2字节的数据。

    VQ2+Str-MRF2:采用矢量量化方法对结构进一步压缩字典词典。

    对比结果如图10所示,VQ2虽然比VQ1消耗更多的内存空间,但达到了更好的字符
    识别的准确率。Str-MRF2和VQ2的组合比VQ1的不仅识别精度更高,内存空间也更小,综合考
    虑,更能满足实际需求。

    以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作
    用未超出本发明技术方案的范围时,均属于本发明的?;し段?。

    关 键 词:
    一种 在线 手写 日文 识别 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:一种在线手写中日文的识别方法.pdf
    链接地址://www.4mum.com.cn/p-6092778.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03