• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 7
    • 下载费用:30 金币  

    重庆时时彩直选杀3码: 一种基于加权混合激励的嵌入式语音合成方法.pdf

    关 键 词:
    一种 基于 加权 混合 激励 嵌入式 语音 合成 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201110145479.4

    申请日:

    2011.06.01

    公开号:

    CN102231275A

    公开日:

    2011.11.02

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 专利权的转移 IPC(主分类):G10L 13/02登记生效日:20190104变更事项:专利权人变更前权利人:珠海宇音天下科技有限公司变更后权利人:北京宇音天下科技有限公司变更事项:地址变更前权利人:519000 广东省珠海市高新区唐家湾镇大学路101号清华科技园(珠海)创业大楼A座A1013变更后权利人:100085 北京市海淀区信息路15号金融科贸大厦915室变更事项:共同专利权人变更后权利人:珠海高新天使创业投资有限公司|||专利权的转移IPC(主分类):G10L 13/02登记生效日:20181023变更事项:专利权人变更前权利人:深圳声联网科技有限公司变更后权利人:珠海宇音天下科技有限公司变更事项:地址变更前权利人:518057 广东省深圳市南山区科技园北区源兴科技大厦北座406变更后权利人:519000 广东省珠海市高新区唐家湾镇大学路101号清华科技园(珠海)创业大楼A座A1013|||专利权的转移IPC(主分类):G10L 13/02登记生效日:20170105变更事项:专利权人变更前权利人:珠海宇音天下科技有限公司变更后权利人:北京宇音天下科技有限公司变更事项:地址变更前权利人:519000 广东省珠海市高新区唐家湾镇大学路101号清华科技园(珠海)创业大楼A座A1013变更后权利人:100085 北京市海淀区信息路15号金融科贸大厦915室|||专利权的转移IPC(主分类):G10L 13/02登记生效日:20170105变更事项:专利权人变更前权利人:北京宇音天下科技有限公司变更后权利人:深圳声联网科技有限公司变更事项:地址变更前权利人:100085 北京市海淀区信息路15号金融科贸大厦915室变更后权利人:518057 广东省深圳市南山区科技园北区源兴科技大厦北座406|||专利权的转移IPC(主分类):G10L 13/02变更事项:专利权人变更前权利人:北京宇音天下科技有限公司变更后权利人:珠海宇音天下科技有限公司变更事项:地址变更前权利人:100085 北京市海淀区信息路15号915室变更后权利人:519000 广东省珠海市高新区唐家湾镇大学路101号清华科技园(珠海)创业大楼A座A1013登记生效日:20140708|||授权|||实质审查的生效IPC(主分类):G10L 13/02申请日:20110601|||公开
    IPC分类号: G10L13/02 主分类号: G10L13/02
    申请人: 北京宇音天下科技有限公司
    发明人: 王朝民; 那兴宇; 谢湘; 何娅玲
    地址: 100085 北京市海淀区信息路15号915室
    优先权:
    专利代理机构: 代理人:
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201110145479.4

    授权公告号:

    |||||||||||||||102231275B||||||

    法律状态公告日:

    2019.01.22|||2018.11.09|||2017.01.25|||2017.01.25|||2014.07.30|||2013.10.16|||2012.03.14|||2011.11.02

    法律状态类型:

    专利申请权、专利权的转移|||专利申请权、专利权的转移|||专利申请权、专利权的转移|||专利申请权、专利权的转移|||专利申请权、专利权的转移|||授权|||实质审查的生效|||公开

    摘要

    本发明公开了一种基于加权混合激励的嵌入式语音合成方法,用于嵌入式操作系统,将接收到的任意文字转换成语音输出。在训练端,首先对语音信号提取基频自适应加权谱内插(STRAIGHT谱)系数、基频及非周期成分;在合成端,通过基频及非周期成分构建混合激励,然后通过传统的参数合成器得到合成语音。依据本发明提供的方法在合成端通过混合激励代替原有的二元激励,在保证较低运算速度的同时,提高了合成语音的自然度和音质,达到与STRAIGHT合成器近似的效果。

    权利要求书

    1.一种基于加权混合激励的嵌入式语音合成方法,用于嵌入式操作系统,将接收到的任
    意文字转换成语音输出。在合成端通过混合激励代替原有的二元激励,在保证较低运算速度
    的同时,提高了合成语音的自然度和音质,达到与STRAIGHT合成器近似的效果。应用该方
    法的语音合成系统分为下述两个部分:
    A.训练部分:首先对语音信号提取STRAIGHT谱、基频及非周期成分,然后对
    STRAIGHT谱提取声道谱特征系数,并将非周期成分在5个频带内取平均值,进而通过HTS
    对特征系数建模、训练;
    B.合成部分:通过模型得到解算出特征系数序列后,通过非周期成分加权混合激励及传
    统参数合成器得到合成语音。
    2.根据权利要求1所述的基于自适应加权谱内插系数的嵌入式语音合成方法,其特征是:
    所述A步,语音合成训练端特征系数序列的提取过程分为下述五个步骤:
    A.对训练语音数据库中的语音信号进行参数提取,分别为基频、增益、STRAIGHT谱
    及非周期成分;
    B.从得到的STRAIGHT谱中再提取声道谱特征系数;
    C.将增益与声道谱特征系数结合成为新的声道谱特征系数;
    D.将非周期成分按照0~1KHz、1~2KHz、2~4KHz、4~6KHz及6~8KHz五个频带,然后
    对每个频带内的非周期成分去平均,每个频带得到一个非周期成分权值,将这5个权值作为
    特征参数序列的一部分。系统采用一般嵌入式系统较为常用的16K采样率;
    E.将基频、新的声道谱系数及分带的非周期成分加权值一并作为特征参数序列进行
    HMM模型训练。
    3.根据权利要求1所述的基于自适应加权谱内插系数的嵌入式语音合成方法,其特征是:
    所述B步,语音合成的合成端合成器合成语音过程分为下述三个步骤:
    A.通过参数解算算法从模型中生成基频、声道谱系数及非周期成分加权序列;
    B.由基频及非周期成分加权序列生成合成语音的激励源,采用混合激励的模型;
    C.将激励源和声道谱系数序列通过传统参数合成器得到合成语音。

    说明书

    一种基于加权混合激励的嵌入式语音合成方法

    技术领域

    本发明总的来说涉及一种基于自适应加权谱内插系数的嵌入式语音合成方法,尤其是存
    储和运算资源有限的终端设备。

    背景技术

    随着移动互联网及物联网技术的蓬勃发展,手机、电子书等嵌入式设备终端逐步成为人
    们日常最直接的信息获取及处理途径,而语音则是最自然最直接的交互手段,因此嵌入式语
    音合成技术的发展乃大势所趋,具有迫切的市场应用需求。

    语音合成技术的宗旨是完美再现人类的声音,也就是让机器能够模仿人类的嗓音、发音
    风格及韵律等特点。传统的语音合成技术是建立在基于大规模语料库的拼接合成方法上,技
    术简单且合成音质高,一度被广泛采用。但这种方法的音库规模大,虽然通过聚类、编码和
    压缩等技术手段处理后,空间可以降低,但音质受到损伤,且灵活度下降。因此,近年来基
    于大规模语料库的统计建模参数合成方法被广泛研究,基本思想是,对大量的原始语音库进
    行参数化表示和统计建模,合成时依照特定规则挑选模型构成模型序列,进一步计算得到合
    成语句的参数序列,通过参数化合成的方法合成符合要求的语音。通过参数化统计建模方法
    合成的语音具有较高的自然度和智能度。目前被大家广泛研究及采用的为基于HMM的语音
    合成技术。语音特征参数的选择很大程度上决定了合成语音的音质,特征参数一般包括激励
    源参数及声道谱参数等。一般的声道谱系数是从短时傅里叶变换谱中提取,在合成端可以直
    接通过传统参数合成器(如倒谱滤波器或线性预测滤波器)完成语音的合成,音质较好。近
    些年提出的自适应加权谱内插(STRAIGHT)语音分析合成算法通过将现有短时傅里叶变换
    谱中时域频域的周期性去除,得到了无周期性扰动的平滑的频谱,可以合成出更高音质的更
    加自然的语音。如果直接只用STRAIGHT作为谱特征从而改善原有的FFT谱虽然可以很大
    程度的改善语音合成音的音质和自然度,但是单纯的使用二元激励并没有完全利用
    STRAIGHT算法的全部优势,其非周期成分是合成高质量高自然度语音的关键,也是音质和
    自然度提升的主要途径。

    因此,需要一种改进的方法,可以在嵌入式平台下实现占用计算资源较小的参数化语音
    合成系统,不但能够使用STRAIGHT谱特征,还能够通过合理使用STRAIGHT算法中的非
    周期成分,使合成语音的音质接近STRAIGHT的合成语音。

    发明内容

    本发明所要解决的技术问题是将STRAIGHT的非周期成分在较低运算量的基础上通过
    混合激励的模式加入到合成语音的激励源中,改善原有的二元激励,使生成的合成语音具有
    更接近STRAIGHT合成音的音质和自然度。

    为实现上述目的,本文提供了一种基于加权混合激励的嵌入式语音合成方法,用于嵌入
    式操作系统,将接收到的任意文字转换成语音输出。在合成端通过混合激励代替原有的二元
    激励,在保证较低运算速度的同时,提高了合成语音的自然度和音质,达到与STRAIGHT合
    成器近似的效果。应用该方法的语音合成系统分为下述两个部分:

    A.训练部分:首先对语音信号提取STRAIGHT谱、基频及非周期成分,然后对
    STRAIGHT谱提取声道谱特征系数,并将非周期成分在5个频带内取平均值,进而通过HTS
    对特征系数建模、训练。

    B.合成部分:通过模型得到解算出特征系数序列后,通过非周期成分加权混合激励及传
    统参数合成器得到合成语音。

    以上所述的基于自适应加权谱内插系数的嵌入式语音合成方法,语音合成训练端特征系
    数序列的提取过程分为下述五个步骤:

    A.对训练语音数据库中的语音信号进行参数提取,分别为基频、增益、STRAIGHT谱
    及非周期成分。

    B.从得到的STRAIGHT谱中再提取声道谱特征系数。

    C.将增益与声道谱特征系数结合成为新的声道谱特征系数。

    D.将非周期成分按照0~1KHz、1~2KHz、2~4KHz、4~6KHz及6~8KHz五个频带,然后
    对每个频带内的非周期成分去平均,每个频带得到一个非周期成分权值,将这5个权值作为
    特征参数序列的一部分。系统采用一般嵌入式系统较为常用的16K采样率。

    E.将基频、新的声道谱系数及分带的非周期成分加权值一并作为特征参数序列进行
    HMM模型训练

    以上所述的基于自适应加权谱内插系数的嵌入式语音合成方法,语音合成的合成端合成
    器合成语音过程分为下述三个步骤:

    A.通过参数解算算法从模型中生成基频、声道谱系数及非周期成分加权序列。

    B.由基频及非周期成分加权序列生成合成语音的激励源,采用混合激励的模型。

    C.将激励源和声道谱系数序列通过传统参数合成器得到合成语音。

    下面结合附图和实施例对本发明进一步说明,通过结合附图对系统各组成部件的详细说
    明将会更好地描述实现本发明的步骤和过程。

    附图说明

    附图1基于HMM的语音合成系统结构框图

    附图2系统特征参数序列提取示意图

    附图3非周期成分加权混合激励语音合成器结构框图

    图中1.语音语料数据库,2.激励源参数提取,3.HMM模型训练,4.HMM模型集,5.由
    HMM模型生成参数,6.文本分析,7.激励源生成,8.合成滤波,9.声道谱参数提取,10.语音
    信号,11.激励源参数,12.声道谱参数,13.合成语音,14.合成文本,15.训练部分,16.合成部
    分,17.标注文本,18.训练端特征参数提取,19.语音信号数据,20.TANDEM-STRAIGHT分
    析,21.STRAIGHT谱,22.LSP系数,23.新LSP系数,24.增益,25.基频,26.非周期成分,
    27.分5个频带取平均,28.带分加权非周期成分,29.lsp[0],27.lsp2ipc,28.LPC滤波器,29.
    合成端参数合成滤波,30.合成端参数合成滤波,31.lsp2lpc,32.混合激励,33.加权,34.非周
    期权值,35.脉冲序列,36.白噪声。

    具体实施方式

    如附图1所示,在本发明的实施方案中,语音合成系统部署在一种嵌入式操作系统中,
    该嵌入式语音合成系统包括:语音合成训练端和合成端。其中,语音合成模型训练部分只在
    系统线下使用,仅用于生成语音合成系统工作时所需要的压缩模型库;而语音合成的合成部
    分则是在芯片上完成。由于本发明重在参数的提取与合成,而文本标注、文本分析、建模、
    训练及参数生成并不是本发明的关注点,所以下面着重介绍训练端的参数提取及参数重建,
    和合成端的混合激励的生成。本实施例选择了LSP系数(22)作为声道谱参数,并选用LPC
    滤波器(28)作为合成滤波器,语音数据为16K采样。

    训练端的特征参数提取(18):

    步骤1,对训练语音数据进行时域稳定功率谱估计(TANDEM-STRAIGHT算法)从而得
    到基频(25)、STRAIGHT谱(21)、增益(24)及非周期成分(26)。

    步骤2,使用广义倒谱分析算法从STRAIGHT谱(21)中提取LPC系数,其中使用美尔
    广义倒谱分析的概念来转换谱系数,然后将所得的LPC系数转换成LSP系数(22)。

    步骤3,将增益代替LSP的第0维参量,生成新的LSP声道谱系数。

    步骤4,通过TANDEM-STRAIGHT分析(20)得到非周期成分(26),然后将非周期成
    分(26)在频域轴上分成五个带,对于16k采样的语音,频带被分为0~1000Hz,1000~2000Hz、
    2000~4000Hz、4000~6000Hz及6000~8000Hz五个带,在每个带内对非周期成分取平均值,
    再将这个值作为该频带非洲成分的加权值,因此每帧语音的非周期成分被简化为5个系数。

    步骤5,将新的LSP声道谱、基频(25)及非周期成分(26)加权值一起做为语音信号
    的特征参数使用HMM模型训练(3)。

    合成端的混合激励的生成(如图3):

    步骤1,由基频(25)来控制脉冲序列(35)和高斯白噪声(36)的生成。

    步骤2,通过非周期成分(26)加权值来控制脉冲序列(35)和高斯白噪声(36)的加
    权混合,得到混合激励(32)。

    步骤3,将混合激励(32)通过由声道参数控制的MLSA滤波器,在通过PSOLA滤波
    器生成最后的合成语音(13)波形。

    上述实例为本发明的较佳实施例,其中声道谱参数(12)可选用MGC,相应的合成滤波
    器则选用MLSA滤波器,效果同样很好,但是MLSA滤波器相对于LPC滤波器对计算能力
    要求偏高,所以在嵌入式设备中,选择LSP系数(22)为佳。

    本发明在嵌入式设备上使用时,所有的音频输入输出均可使用设备本身提供的输入输出
    接口。语音功能可以随时在设备上开启或关闭。在未启用语音功能时,原设备的各种功能不
    受任何影响。

    本发明的应用可用于各种嵌入式终端设备。根据本发明的主要构思,本领域的普通技术
    人员均可以产生多种类低的或等价的应用。因此,本发明的?;びσ匀ɡ蟮谋;し段?br />准。

    关于本文
    本文标题:一种基于加权混合激励的嵌入式语音合成方法.pdf
    链接地址://www.4mum.com.cn/p-5870805.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 大乐透每天几点到几点能买 必赢客有手机版本吗 体彩河南泳坛夺金481 后三不定位最佳方法 七星彩秘籍预测码 上海快三怎么玩稳赚 重庆时时龙虎合开奖图 广东11选5计划软件手机版下载 黑马全人工计划软件黑马计划官网 赌场里赌龙虎有何技巧 前三组选包胆规则 3期计划防止连挂倍投法 腾讯分分彩组选包胆 江苏时时票开奖结果 幸运28预测在pc28点sc 北京pk10走势及看法