• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 10
    • 下载费用:30 金币  

    重庆时时彩预测辅助工具hao123: 一种基于长短时记忆网络的语言模型重估方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201510844693.7

    申请日:

    2015.11.26

    公开号:

    CN106803422A

    公开日:

    2017.06.06

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G10L 15/06申请日:20151126|||公开
    IPC分类号: G10L15/06(2013.01)I 主分类号: G10L15/06
    申请人: 中国科学院声学研究所; 北京中科信利技术有限公司
    发明人: 张鹏远; 左玲云; 潘接林; 颜永红
    地址: 100190 北京市海淀区北四环西路21号
    优先权:
    专利代理机构: 北京方安思达知识产权代理有限公司 11472 代理人: 王宇杨;陈琳琳
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201510844693.7

    授权公告号:

    |||

    法律状态公告日:

    2017.06.30|||2017.06.06

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明提出了一种基于长短时记忆网络的语言模型重估方法及系统,所述方法包含:步骤100)输入待识别的语言信息,并对输入的待识别的语言信息进行预处理;步骤101)用N元文法语言模型对预处理后的信息进行一遍解码,然后从中选取M个最优的候选结果;步骤102)在获得的M个最优的候选结果中引入一遍解码的识别结果作为历史句子信息;步骤103)用高元文法语言模型对选取的M个最优的候选结果进行重评估;步骤104)用基于LSTM结构的神经网络训练语言模型对引入历史句子信息的M个最优的候选结果进行重评估;步骤105)将用高元文法语言模型进行重评估的结果与用LSTM神经网络语言模型重评估的结果进行融合,选出最优结果,作为待识别的语言信息的最终识别结果。

    权利要求书

    1.一种基于长短时记忆网络的语言模型重估方法,所述方法包含:
    步骤100)输入待识别的语言信息,并对输入的待识别的语言信息进行预处理;
    步骤101)用N元文法语言模型对预处理后的信息进行一遍解码,然后从中选
    取M个最优的候选结果;
    步骤102)在获得的M个最优的候选结果中引入一遍解码的识别结果作为历史
    句子信息;
    步骤103)用高元文法语言模型对选取的M个最优的候选结果进行重评估;
    步骤104)用基于长短时记忆网络结构的神经网络训练语言模型对引入历史句子
    信息的M个最优的候选结果进行重评估;
    其中,针对电话交谈语料的上下文相关的特性,在进行重估时,用一遍解码的
    结果作为历史句子信息,对选取的M个最优候选结果用LSTM神经网络语言模型进
    行重评估;
    步骤105)将用高元文法语言模型进行重评估的结果与用LSTM神经网络语言
    模型重评估的结果进行融合,选出最优结果,作为待识别的语言信息的最终识别结
    果。
    2.根据权利要求1所述的基于长短时记忆网络的语言模型重估方法,其特在于,
    所述步骤100)具体为:
    首先,将输入的语言信息切分为若干具有同一声学性质的音频片段;
    然后,从音频片段中提取基频、感知线性预测系数(PLP)和异方差线性判别分
    析(HLDA)等特征,得到预处理后的信号。
    3.根据权利要求1所述的基于长短时记忆网络的语言模型重估方法,其特在于,
    所述步骤101)具体为:
    步骤101-1)当N取值为3时,用CTS语料训练三元文法语言模型,用通用语
    料训练三元文法语言模型,然后将这两种模型在开发集上进行插值调优得到插值后
    的三元文法语言模型;
    步骤101-2)用插值得到的三元文法语言模型对待识别的语言信息进行一遍解
    码,得到一遍识别结果,并选M个最优候选结果用于后续重估。
    4.根据权利要求3所述的基于长短时记忆网络的语言模型重估方法,其特在于,
    所述步骤103)进一步包含:
    步骤103-1)当高元文法语言模型的N取值为4时,用CTS语料训练四元文法
    语言模型,用通用语料训练四元文法语言模型,然后将这两种模型在开发集上进行
    插值调优得到插值后的四元文法语言模型;
    步骤103-2)用插值得到的四元文法语言模型对一遍解码得到的M个最优候选
    结果进行重评估。
    5.根据权利要求3所述的基于长短时记忆网络的语言模型重估方法,其特在于,
    所述步骤104)进一步包含:
    步骤104-1)用CTS语料训练基于LSTM结构的神经网络语言模型;
    步骤104-2)用训练后的LSTM神经网络语言模型对得到的引入历史句子信息后
    的最优候选文本进行重评估。
    6.根据权利要求4或5所述的基于长短时记忆网络的语言模型重估方法,其特
    在于,所述步骤105)进一步包含:
    将四元文法语言模型重评估的结果与神经网络语言模型重评估的结果以
    (0.5,0.5)的比例进行融合,选出最优的结果作为最终的识别结果。
    7.一种基于长短时记忆网络的语言模型重估系统,其特征在于,所述系统包含:
    预处理???,用于接收待识别的语音,并对输入的语言信息进行预处理操作;
    第一遍解码???,用于根据N元文法语言模型对预处理后的信息进行一遍解码,
    然后从中选取M个最优的候选结果;
    历史信息添加???,用于对第一遍解码??槭涑龅男畔⒅幸胍槐榻饴氲氖侗?br />结果作为历史句子信息;
    重估???,用于采用高元文法语言模型对选取的M个最优的候选结果进行重评
    估;还采用基于LSTM结构的神经网络训练语言模型对引入历史句子信息的M个最
    优的候选结果进行重评估;
    和融合处理???,用于将用高元文法语言模型进行重评估的结果与用LSTM神
    经网络语言模型重评估的结果进行融合,选出最优结果,作为待识别的语言信息的
    最终识别结果。
    8.根据权利要求7所述的基于长短时记忆网络的语言模型重估系统,其特征在
    于,所述预处理??榻徊桨?br />
    语音分段子???,用于将输入的语言信息切分为若干具有同一声学性质的音频
    片段;
    特征提取和规整子???,用于从音频片段中提取基频、感知线性预测系数(PLP)
    和异方差线性判别分析(HLDA)等特征,进而用于后续解码阶段。
    9.根据权利要求7所述的基于长短时记忆网络的语言模型重估系统,其特征在
    于,所述第一遍解码??榻徊桨?br />
    三元文法语言获取子???,用于当N取值为3时,用CTS语料训练三元文法语
    言模型,用通用语料训练三元文法语言模型,然后将这两种模型在开发集上进行插
    值调优得到插值后的三元文法语言模型;
    解码子???,用于基于插值得到的三元文法语言模型对待识别的语言信息进行
    一遍解码,得到一遍识别结果,并选M个最优候选结果用于后续重估。

    关 键 词:
    一种 基于 短时记忆 网络 语言 模型 重估 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:一种基于长短时记忆网络的语言模型重估方法.pdf
    链接地址://www.4mum.com.cn/p-6000683.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03