• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 26
    • 下载费用:30 金币  

    重庆时时彩杀胆码: 基音周期估计值修正方法、基音估计方法和相关装置.pdf

    关 键 词:
    基音 周期 估计值 修正 方法 估计 相关 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201110118266.2

    申请日:

    2011.05.09

    公开号:

    CN102231274A

    公开日:

    2011.11.02

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G10L 11/04申请日:20110509|||公开
    IPC分类号: G10L11/04; G10L19/08 主分类号: G10L11/04
    申请人: 华为技术有限公司
    发明人: 党红强; 刘贵忠; 顿玉洁; 杜正中
    地址: 518129 广东省深圳市龙岗区坂田华为总部办公楼
    优先权:
    专利代理机构: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 彭愿洁;李文红
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201110118266.2

    授权公告号:

    102231274B||||||

    法律状态公告日:

    2013.04.17|||2011.12.14|||2011.11.02

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明提供基音周期估计值修正方法,包括:当前子帧在当前频率区域内MCAMD的序列最大值MAmax(i+1)大于中间变量MAmax的加权值时,分别以MAmax(i+1)和MAmax(i+1)的延迟替代中间变量MAmax和中间变量Topt;若中间变量Topt与当前子帧前奇数个子帧的基音周期估计中值Tpre_mid_o的比值小于校正因子r1或大于校正因子r2并且Tpre_mid_o邻近范围内当前子帧的MCAMD的序列最大值MAmax0大于中间变量MAmax与经验因子ρ2的乘积,用MAmax0对应的延迟T0校正中间变量Topt;将当前子帧前偶数个子帧的基音周期估计值与中间变量Topt进行中值滤波。

    权利要求书

    1.一种基音周期估计值修正方法,其特征在于,所述方法包括:
    比较当前子帧在当前频率区域内修正循环平均幅度差序列最大值MAmax
    (i+1)与第一中间变量MAmax的加权值,若所述MAmax(i+1)大于所述MAmax
    的加权值,则分别以所述MAmax(i+1)和所述MAmax(i+1)对应的延迟T(i+1)
    替代第一中间变量MAmax和第二中间变量Topt,重复所述比较过程,直至所述
    当前频率区域不在基音频率范围之内;
    计算所述第二中间变量Topt与所述当前子帧前奇数个子帧的基音周期估计
    中值Tpre_mid_o的比值,若所述比值小于第一校正因子或大于第二校正因子并且
    所述Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差序列最大值
    MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积,则用所述MAmax0
    对应的延迟T0校正第二中间变量Topt;
    将所述当前子帧前偶数个子帧的基音周期估计值与第二中间变量Topt进行
    中值滤波,以进行所述中值滤波后得到的值作为中间子帧的基音周期估计值;
    所述第一中间变量MAmax的加权值是所述MAmax与第一经验因子的乘积,
    所述用所述MAmax0对应的延迟T0校正第二中间变量Topt是将第二中间变量Topt
    的当前值设置为所述MAmax0对应的延迟T0,所述中间子帧是所述当前子帧前偶
    数个子帧和所述当前子帧构成的若干子帧中子帧编号为中间值的子帧,所述偶
    数是小于所述奇数的最大偶数。
    2.如权利要求1所述的方法,其特征在于,所述基音频率范围为[80Hz,
    4000Hz),所述频率区域是在[80Hz,4000Hz)内划分的第一频率区域[80Hz,
    160Hz)、第二频率区域[160Hz,320Hz)、第三频率区域[320Hz,640Hz)、第
    四频率区域[640Hz,1280Hz)和第五频率区域[1280Hz,4000Hz);
    所述比较当前子帧在当前频率区域内修正循环平均幅度差序列最大值
    MAmax(i+1)与第一中间变量MAmax的加权值包括:
    预设第一中间变量MAmax值为当前子帧在[80Hz,160Hz)内修正循环平均
    幅度差序列最大值MAmax(1),预设第二中间变量Topt值为所述MAmax(1)对
    应的延迟T(1);
    若当前子帧在[160Hz,320Hz)内修正循环平均幅度差序列最大值MAmax
    (2)大于所述MAmax的加权值,则分别以所述MAmax(2)和所述MAmax(2)
    对应的延迟T(2)替代所述MAmax和所述Topt;
    若当前子帧在[320Hz,640Hz)内修正循环平均幅度差序列最大值MAmax
    (3)大于所述MAmax的加权值,则分别以所述MAmax(3)和所述MAmax(3)
    对应的延迟T(3)替代所述MAmax和所述Topt;
    若当前子帧在[640Hz,1280Hz)内修正循环平均幅度差序列最大值MAmax
    (4)大于所述MAmax的加权值,则分别以所述MAmax(4)和所述MAmax(4)
    对应的延迟T(4)替代所述MAmax和所述Topt;
    若当前子帧在[1280Hz,4000Hz)内修正循环平均幅度差序列最大值MAmax
    (5)大于所述MAmax的加权值,则分别以所述MAmax(5)和所述MAmax(5)
    对应的延迟T(5)替代所述MAmax和所述Topt。
    3.如权利要求1所述的方法,其特征在于,所述当前子帧前奇数个子帧的
    基音周期估计中值Tpre_mid_o为所述当前子帧前5个子帧的基音周期估计中值
    Tpre_mid_o;
    所述当前子帧前5个子帧的基音周期估计中值Tpre_mid_o为所述当前子帧前5
    个子帧中编号为中间值的子帧的基音周期估计值;
    所述计算所述第二中间变量Topt与所述当前子帧前奇数个子帧的基音周期
    估计中值Tpre_mid_o的比值为:
    计算所述第二中间变量Topt与所述当前子帧前5个子帧中编号为中间值的
    子帧的基音周期估计值的比值。
    4.如权利要求1所述的方法,其特征在于,所述Tpre_mid_o邻近范围内所述
    当前子帧的修正循环平均幅度差序列最大值MAmax0大于所述第一中间变量
    MAmax与第二经验因子的乘积为:
    所述Tpre_mid_o邻近1毫秒范围内所述当前子帧的修正循环平均幅度差序列
    最大值MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积。
    所述用所述MAmax0对应的延迟T0校正第二中间变量Topt是将第二中间变量
    Topt的当前值设置为Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差
    序列最大值MAmax0对应的延迟T0。
    5.如权利要求1所述的方法,其特征在于,所述将所述当前子帧前偶数个
    子帧的基音周期估计值与第二中间变量Topt进行中值滤波包括:
    将所述当前子帧前4个子帧的基音周期估计值与第二中间变量Topt进行中
    值滤波。
    6.如权利要求1至5任意一项所述的方法,其特征在于,所述第一经验因
    子为0.95,所述第一校正因子为0.75,所述第二校正因子为1.4,所述第二经验
    因子为0.85。
    7.一种基音周期估计值修正装置,其特征在于,所述装置包括:
    比较???,用于比较当前子帧在当前频率区域内修正循环平均幅度差序列
    最大值MAmax(i+1)与第一中间变量MAmax的加权值,若所述MAmax(i+1)大
    于所述MAmax的加权值,则分别以所述MAmax(i+1)和所述MAmax(i+1)对应
    的延迟T(1)替代第一中间变量MAmax和第二中间变量Topt,重复所述比较过
    程,直至所述当前频率区域不在基音频率范围之内;
    校正???,用于计算所述第二中间变量Topt与所述当前子帧前奇数个子帧
    的基音周期估计中值Tpre_mid_o的比值,若所述比值小于第一校正因子或大于第
    二校正因子并且所述Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差
    序列最大值MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积,则用
    所述MAmax0对应的延迟T0校正第二中间变量Topt;
    中值滤波???,用于将所述当前子帧前偶数个子帧的基音周期估计值与第
    二中间变量Topt进行中值滤波,以进行所述中值滤波后得到的基音周期估计值
    作为中间子帧的基音周期估计值;
    所述第一中间变量MAmax的加权值是所述MAmax与第一经验因子的乘积,
    所述用所述MAmax0对应的延迟T0校正第二中间变量Topt是将第二中间变量Topt
    的当前值设置为所述MAmax0对应的延迟T0,所述中间子帧是所述当前子帧的前
    偶数个子帧和所述当前子帧构成的若干子帧中子帧编号为中间值的子帧,所述
    偶数是小于所述奇数的最大偶数。
    8.如权利要求7所述的装置,其特征在于,所述基音频率范围为[80Hz,
    4000Hz),所述频率区域是在[80Hz,4000Hz)内划分的第一频率区域[80Hz,
    160Hz)、第二频率区域[160Hz,320Hz)、第三频率区域[320Hz,640Hz)、第
    四频率区域[640Hz,1280Hz)和第五频率区域[1280Hz,4000Hz);
    所述比较??榫咛逵糜冢?br />预设第一中间变量MAmax值为当前子帧在[80Hz,160Hz)内修正循环平均
    幅度差序列最大值MAmax(1),预设第二中间变量Topt值为所述MAmax(1)对
    应的延迟T(1);
    若当前子帧在[160Hz,320Hz)内修正循环平均幅度差序列最大值MAmax
    (2)大于所述MAmax的加权值,则分别以所述MAmax(2)和所述MAmax(2)
    对应的延迟T(2)替代所述MAmax和所述Topt;
    若当前子帧在[320Hz,640Hz)内修正循环平均幅度差序列最大值MAmax
    (3)大于所述MAmax的加权值,则分别以所述MAmax(3)和所述MAmax(3)
    对应的延迟T(3)替代所述MAmax和所述Topt;
    若当前子帧在[640Hz,1280Hz)内修正循环平均幅度差序列最大值MAmax
    (4)大于所述MAmax的加权值,则分别以所述MAmax(4)和所述MAmax(4)
    对应的延迟T(4)替代所述MAmax和所述Topt;
    若当前子帧在[1280Hz,4000Hz)内修正循环平均幅度差序列最大值MAmax
    (5)大于所述MAmax的加权值,则分别以所述MAmax(5)和所述MAmax(5)
    对应的延迟T(5)替代所述MAmax和所述Topt。
    9.如权利要求7所述的装置,其特征在于,所述当前子帧前奇数个子帧的
    基音周期估计中值Tpre_mid_o为所述当前子帧前5个子帧的基音周期估计中值
    Tpre_mid_o;
    所述当前子帧前5个子帧的基音周期估计中值Tpre_mid_o为所述当前子帧前5
    个子帧中编号为中间值的子帧的基音周期估计值;
    所述Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差序列最大值
    MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积为所述Tpre_mid_o邻
    近1毫秒范围内所述当前子帧的修正循环平均幅度差序列最大值MAmax0大于所
    述第一中间变量MAmax与第二经验因子的乘积;
    所述用所述MAmax0对应的延迟T0校正第二中间变量Topt是将第二中间变量
    Topt的当前值设置为所述MAmax0对应的延迟T0;
    所述校正??榫咛逵糜冢?br />计算所述第二中间变量Topt与所述当前子帧前5个子帧中编号为中间值的
    子帧的基音周期估计值的比值;
    若所述比值小于第一校正因子或大于第二校正因子并且所述Tpre_mid_o邻近
    1毫秒范围内所述当前子帧的修正循环平均幅度差序列最大值MAmax0大于所述
    第一中间变量MAmax与第二经验因子的乘积,则将第二中间变量Topt的当前值
    设置为所述MAmax0对应的延迟T0。
    10.如权利要求7所述的装置,其特征在于,所述中值滤波??榫咛逵糜冢?br />将所述当前子帧前4个子帧的基音周期估计值Tpre_e与第二中间变量Topt进
    行中值滤波。
    11.一种基音估计方法,其特征在于,所述方法包括:
    对接收的信号进行预处理,所述信号包括语音信号或音频信号;
    对所述经过预处理的信号计算其归一化互相关序列,根据所述得到的归一
    化互相关序列求取所述归一化互相关序列的修正循环平均幅度差序列;
    根据所述修正循环平均幅度差序列在基音频率范围内的最大值对应的延
    迟,对基音延迟估计值进行修正,以所述修正所得的延迟估计值为所述信号的
    基音周期估计值。
    12.如权利要求11所述的方法,其特征在于,所述对接收的信号进行预处
    理包括对所述信号的静音帧和非静音帧进行判断;
    所述对所述经过预处理的信号计算其归一化互相关序列,根据所述归一化
    互相关序列求取所述归一化互相关序列的修正循环平均幅度差序列为:
    对所述经过预处理的非静音帧信号计算其归一化互相关序列,根据所述得
    到的非静音帧信号的归一化互相关序列求取所述非静音帧信号的归一化互相
    关序列的修正循环平均幅度差序列。
    13.如权利要求11所述的方法,其特征在于,所述根据所述修正循环平均
    幅度差序列在基音频率范围内的最大值对应的延迟,对基音延迟估计值进行修
    正包括:
    比较当前子帧在当前频率区域内修正循环平均幅度差序列最大值MAmax
    (i+1)与第一中间变量MAmax的加权值,若所述MAmax(i+1)大于所述MAmax
    的加权值,则分别以所述MAmax(i+1)和所述MAmax(i+1)对应的延迟替代
    第一中间变量MAmax和第二中间变量Topt,重复所述比较过程,直至所述当前
    频率区域不在基音频率范围之内;
    计算所述第二中间变量Topt与所述当前子帧前奇数个子帧的基音周期估计
    中值Tpre_mid_o的比值,若所述比值小于第一校正因子或大于第二校正因子并且
    所述Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差序列最大值
    MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积,则用所述MAmax0
    对应的延迟T0校正第二中间变量Topt;
    将所述当前子帧前偶数个子帧的基音周期估计值与第二中间变量Topt进行
    中值滤波,以进行所述中值滤波后得到的值作为中间子帧的基音周期估计值;
    所述第一中间变量MAmax的加权值是所述MAmax与第一经验因子的乘积,
    所述用所述MAmax0对应的延迟T0校正第二中间变量Topt是将第二中间变量Topt
    的当前值设置为所述MAmax0对应的延迟T0,所述中间子帧是所述当前子帧前偶
    数个子帧和所述当前子帧构成的若干子帧中子帧编号为中间值的子帧,所述偶
    数是小于所述奇数的最大偶数。
    14.一种基音估计装置,其特征在于,所述装置包括:
    预处理???,用于对接收的信号进行预处理,所述信号包括语音信号或音
    频信号;
    序列求取???,用于对所述经过预处理的信号计算其归一化互相关序列,
    根据所述得到的归一化互相关序列求取所述归一化互相关序列的修正循环平
    均幅度差序列;
    修正???,用于根据所述修正循环平均幅度差序列在基音频率范围内的最
    大值对应的延迟,对基音延迟估计值进行修正,以所述修正所得的延迟估计值
    为所述信号的基音周期估计值。
    15.如权利要求14所述的装置,其特征在于,所述预处理??榛拱ㄅ卸?br />单元,用于对接收的信号进行预处理包括对所述信号的静音帧和非静音帧进行
    判断;
    所述序列求取??榫咛逵糜冢?br />对所述经过预处理的非静音帧信号计算其归一化互相关序列,根据所述得
    到的非静音帧信号的归一化互相关序列求取所述非静音帧信号的归一化互相
    关序列的修正循环平均幅度差序列。
    16.如权利要求14所述的装置,其特征在于,所述修正??榘ǎ?br />比较单元,用于比较当前子帧在当前频率区域内修正循环平均幅度差序列
    最大值MAmax(i+1)与第一中间变量MAmax的加权值,若所述MAmax(i+1)大
    于所述MAmax的加权值,则分别以所述MAmax(i+1)和所述MAmax(i+1)对应
    的延迟T(1)替代第一中间变量MAmax和第二中间变量Topt,重复所述比较过
    程,直至所述当前频率区域不在基音频率范围之内;
    校正单元,用于计算所述第二中间变量Topt与所述当前子帧前奇数个子帧
    的基音周期估计中值Tpre_mid_o的比值,若所述比值小于第一校正因子或大于第
    二校正因子并且所述Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差
    序列最大值MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积,则用
    所述MAmax0对应的延迟T0校正第二中间变量Topt;
    中值滤波单元,用于将所述当前子帧前偶数个子帧的基音周期估计值与第
    二中间变量Topt进行中值滤波,以进行所述中值滤波后得到的基音周期估计值
    作为中间子帧的基音周期估计值;
    所述第一中间变量MAmax的加权值是所述MAmax与第一经验因子的乘积,
    所述用所述MAmax0对应的延迟T0校正第二中间变量Topt是将第二中间变量Topt
    的当前值设置为所述MAmax0对应的延迟T0,所述中间子帧是所述当前子帧前偶
    数个子帧和所述当前子帧构成的若干子帧中子帧编号为中间值的子帧,所述偶
    数是小于所述奇数的最大偶数。

    说明书

    基音周期估计值修正方法、基音估计方法和相关装置

    技术领域

    本发明涉及信号处理领域,尤其涉及基音周期估计值修正方法、基音估计
    方法和相关装置。

    背景技术

    在语音信号处理领域,基音的原始含义是指发浊音时声带振动所引起的周
    期性特征,基音周期是声带振动频率的倒数。在音频信号处理领域,基音也具
    有类似的含义。从时域角度来看,周期信号的最明显特征是波形的类似性。依
    赖波形类似性的基音检测算法的主要原理是通过比较原始信号和它移位后的
    信号之间的类似性来确定基音周期。如果移位距离等于基音周期,那么,两个
    信号具有最大类似性(或者互相关最大)。无论是语音信号处理领域还是音频
    信号处理领域,基音的检测或基音周期的估计都是一项非常重要的技术,因为,
    通过基音检测和估计,提取信号的基频,就能够获知信号的变化快慢,从而了
    解信号的特征,为进一步的信号处理提供必要的参考。

    基音检测和估计算法较多,通常分为时域方法和频域方法两大类,其中,
    时域方法主要包括自相关函数法(Autocorrelation?Function,ACF)、平均幅度
    差函数法(Average?Magnitude?Difference?Function,AMDF)和简单逆滤波跟
    踪法(Simple?Inverse?Filtering?Tracking,SIFT)等,频域方法主要包括谐波积
    谱法(Harmonic?Product?Spectrum?Method)和倒谱法(Ceptrum?Method,CM)
    从计算复杂度方面考虑,自相关法和其他方法相比,计算量低且性能上和其他
    方法差不多。

    在众多的基音检测和估计算法中,现有技术提供的一种方法是基于归一化
    互相关函数的基音估计方法。在该方法中,首先对输入的信号进行预处理,包
    括高通滤波、低通滤波、去均值、数值平滑等;然后,对经过预处理的信号计
    算其归一化互相关序列,得到互相关序列R(i),计算出的R(i)的最大值对应的
    延迟可以作为基音周期估计值;最后,使用中值滤波器对基音周期估计值进行
    平滑,平滑的目的主要是为了去除基音估计值中的“野点”,即倍频/半频错
    误。

    上述现有技术中,归一化互相关函数法是通过当前信号和过去信号相比
    较,波形相似则信号的归一化互相关函数会出现峰值。如果信号的基音周期较
    小,且有较好的周期性,则互相关序列会包含多个周期,即,在互相关序列中
    会出现多个极大值。由于谐波的影响,这些极大值中,最大值往往不是第一个
    周期点对应的极大值,因此,归一化互相关函数法容易出现半频错误,从而导
    致中值滤波器对基音周期估计值进行平滑的效果不佳。

    发明内容

    本发明实施例提供了基音周期估计值修正方法、基音估计方法和相关装
    置,用于解决现有技术对基音周期估计值进行平滑时效果不佳的问题。

    本发明实施例提供一种基音周期估计值修正方法,包括:比较当前子帧在
    当前频率区域内修正循环平均幅度差序列最大值MAmax(i+1)与第一中间变量
    MAmax的加权值,若所述MAmax(i+1)大于所述MAmax的加权值,则分别以所
    述MAmax(i+1)和所述MAmax(i+1)对应的延迟T(i+1)替代第一中间变量
    MAmax和第二中间变量Topt,重复所述比较过程,直至所述当前频率区域不在
    基音频率范围之内;

    计算所述第二中间变量Topt与所述当前子帧前奇数个子帧的基音周期估计
    中值Tpre_mid_o的比值,若所述比值小于第一校正因子或大于第二校正因子并且
    所述Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差序列最大值
    MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积,则用所述MAmax0
    对应的延迟T0校正第二中间变量Topt;

    将所述当前子帧前偶数个子帧的基音周期估计值与第二中间变量Topt进行
    中值滤波,以进行所述中值滤波后得到的值作为中间子帧的基音周期估计值;

    所述第一中间变量MAmax的加权值是所述MAmax与第一经验因子的乘积,
    所述用所述MAmax0对应的延迟T0校正第二中间变量Topt是将第二中间变量Topt
    的当前值设置为所述MAmax0对应的延迟T0,所述中间子帧是所述当前子帧前偶
    数个子帧和所述当前子帧构成的若干子帧中子帧编号为中间值的子帧,所述偶
    数是小于所述奇数的最大偶数。

    本发明实施例提供一种基音周期估计值修正装置,包括:比较???,用于
    比较当前子帧在当前频率区域内修正循环平均幅度差序列最大值MAmax(i+1)
    与第一中间变量MAmax的加权值,若所述MAmax(i+1)大于所述MAmax的加权
    值,则分别以所述MAmax(i+1)和所述MAmax(i+1)对应的延迟T(1)替代
    第一中间变量MAmax和第二中间变量Topt,重复所述比较过程,直至所述当前
    频率区域不在基音频率范围之内;

    校正???,用于计算所述第二中间变量Topt与所述当前子帧前奇数个子帧
    的基音周期估计中值Tpre_mid_o的比值,若所述比值小于第一校正因子或大于第
    二校正因子并且所述Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差
    序列最大值MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积,则用
    所述MAmax0对应的延迟T0校正第二中间变量Topt;

    中值滤波???,用于将所述当前子帧前偶数个子帧的基音周期估计值与第
    二中间变量Topt进行中值滤波,以进行所述中值滤波后得到的基音周期估计值
    作为中间子帧的基音周期估计值;

    所述第一中间变量MAmax的加权值是所述MAmax与第一经验因子的乘积,
    所述用所述MAmax0对应的延迟T0校正第二中间变量Topt是将第二中间变量Topt
    的当前值设置为所述MAmax0对应的延迟T0,所述中间子帧是所述当前子帧的前
    偶数个子帧和所述当前子帧构成的若干子帧中子帧编号为中间值的子帧,所述
    偶数是小于所述奇数的最大偶数。

    本发明实施例提供一种基音估计方法,包括:对接收的信号进行预处理,
    所述信号包括语音信号或音频信号;

    对所述经过预处理的信号计算其归一化互相关序列,根据所述得到的归一
    化互相关序列求取所述归一化互相关序列的修正循环平均幅度差序列;

    根据所述修正循环平均幅度差序列在基音频率范围内的最大值对应的延
    迟,对基音延迟估计值进行修正,以所述修正所得的延迟估计值为所述信号的
    基音周期估计值。

    本发明实施例提供一种基音估计装置,包括:预处理???,用于对接收的
    信号进行预处理,所述信号包括语音信号或音频信号;

    序列求取???,用于对所述经过预处理的信号计算其归一化互相关序列,
    根据所述得到的归一化互相关序列求取所述归一化互相关序列的修正循环平
    均幅度差序列;

    修正???,用于根据所述修正循环平均幅度差序列在基音频率范围内的最
    大值对应的延迟,对基音延迟估计值进行修正,以所述修正所得的延迟估计值
    为所述信号的基音周期估计值。

    从上述本发明提供的实施例可知,由于修正循环平均幅度差序列是从具有
    良好周期性的归一化互相关序列推衍而得,处理修正循环平均幅度差序列最大
    值及其延迟值,通过循环比较相邻频率区域内修正循环平均幅度差序列最大
    值,最终确定当前子帧的修正循环平均幅度差序列最大值及其延迟,可以降低
    归一化互相关序列算法估计基音周期时出现半频/倍频错误的概率,而将当前
    子帧修正循环平均幅度差序列最大值的延迟与当前子帧前偶数个子帧的基音
    周期估计值进行中值滤波,则可以进一步减少估算基音周期时出现的半频/倍
    频错误,相当于进一步提高了基音周期估计的准确度。

    附图说明

    为了更清楚地说明本发明实施例的技术方案,下面将对现有技术或实施例
    描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅
    是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动
    性的前提下,还可以如这些附图获得其他的附图。

    图1是本发明实施例提供的基音周期估计值修正方法流程示意图;

    图2是本发明另一实施例提供的基音周期估计值修正方法流程示意图;

    图3是本发明实施例提供的基音估计方法流程示意图;

    图4是本发明实施例提供的一种基音周期估计值修正装置逻辑结构示意
    图;

    图5是本发明实施例提供的一种基音估计装置逻辑结构示意图;

    图6是本发明另一实施例提供的一种基音估计装置逻辑结构示意图;

    图7是本发明另一实施例提供的一种基音估计装置逻辑结构示意图;

    图8是基音估计装置用于语音音频统一编码的时间规整技术??榈慕峁故?br />意图;

    图9是本发明实施例提供的语音信号基音估计系统逻辑结构示意图。

    具体实施方式

    下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清
    楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是
    全部的实施例?;诒痉⒚髦械氖凳├?,本领域普通技术人员在没有做出创造
    性劳动前提下所获得的所有其他实施例,都属于本发明?;さ姆段?。

    请参阅附图1,是本发明实施例提供的基音周期估计值修正方法流程示意
    图,主要包括步骤:

    S101,比较当前子帧在当前频率区域内修正循环平均幅度差序列最大值
    MAmax(i+1)与第一中间变量MAmax的加权值,若所述MAmax(i+1)大于所述
    MAmax的加权值,则分别以所述MAmax(i+1)和所述MAmax(i+1)对应的延迟
    T(i+1)替代第一中间变量MAmax和第二中间变量Topt,重复所述比较过程,
    直至所述当前频率区域不在基音频率范围之内。

    考虑到可以将一帧信号,例如,语音信号或音频信号,划分为16个子帧,
    因此,在本发明实施例中,可以是以一个子帧为单位,进行基音周期估计值的
    修正。进一步地,由于互相关序列具有良好的周期性,因此,在本发明实施例
    中,可以通过计算信号的归一化互相关序列,将信号转换成归一化互相关序列,
    进而求取修正循环平均幅度差序列最大值。如此,在基音估计中可以不用考虑
    原始信号的起始时间,而是可以利用归一化互相关序列的第一个最大值的位置
    来估计基音周期。

    对于语音信号或音频信号,基音频率范围一般在60Hz~4000Hz之间,而
    能够被人耳感觉到的基音频率范围集中于80Hz~2500Hz之间。为了对基音周
    期进行估计,可以事先将基音频率范围划分若干个频率区域。

    在本发明提供的一个实施例中,将80Hz~2500Hz的基音频率范围划分成
    第一频率区域[80,240)Hz、第二频率区域[240,720)Hz和第三频率区域[720,
    2500)Hz。然后,比较当前子帧在当前频率区域内修正循环平均幅度差
    (MCAMD,Modified?Circular?Average?Magnitude?Difference)序列最大值MAmax
    (i+1)与第一中间变量MAmax的加权值,例如,比较当前子帧在第二频率区域
    [240,720)内MCAMD序列最大值MAmax(2)与第一中间变量MAmax的加权
    值以及比较当前子帧在第三频率区域[720,2500)内MCAMD序列最大值MAmax
    (3)与第一中间变量MAmax的加权值。

    由于基音估计最容易出现的是倍频/半频错误(即基音估计值中的“野
    点”),为了避免一开始时就出现这种错误,应当尽可能使相邻的MCAMD序列
    最大值对应的两个频率大小呈两倍或半倍关系,即倍频/半频关系。例如,当
    一个MCAMD序列最大值对应的频率为100Hz,则应该使相邻MCAMD序列最
    大值对应的频率为200Hz或50Hz。在本发明实施例中,当将80Hz~4000Hz的
    基音频率范围按照如下方式划分为若干频率区域:每个频率区域的两个端值呈
    倍数关系,频率区域是连续的,即前一个频率区域的右端值(即该频率区域两
    个端值中较大的一个)与后一个频率区域的左端值(即该频率区域两个端值中
    较小的一个)重叠。例如,在基音频率范围80Hz~4000Hz之间,划分第一频
    率区域为[80Hz,160Hz)、第二频率区域为[160Hz,320Hz)、第三频率区域为
    [320Hz,640Hz)、第四频率区域为[640Hz,1280Hz)和第五频率区域为[1280Hz,
    4000Hz)。如此,相邻的MCAMD序列最大值在相邻的频率区域对应的两个频
    率大小呈两倍或半倍关系的可能性较大,从而使后续对基音估计值的修正更加
    准确。

    如果当前子帧在当前频率区域内MCAMD序列最大值MAmax(i+1)大于第
    一中间变量MAmax的加权值,则以当前子帧在当前频率区域内MCAMD序列最
    大值MAmax(i+1)替代第一中间变量MAmax,以当前子帧在当前频率区域内
    MCAMD序列最大值MAmax(i+1)对应的延迟T(i+1)替代第二中间变量Topt,
    并且重复上述比较过程,直至当前频率区域不在基音频率范围之内。例如,在
    算法最初,设定第一中间变量MAmax为当前子帧在第一频率区域[80Hz,
    160Hz)内MCAMD序列最大值MAmax(1),设定第二中间变量Topt为MAmax(1)
    对应的延迟T(1)。第一经验因子为ρ1,假设当前子帧在第二频率区域[160Hz,
    320Hz)内MCAMD序列最大值MAmax(2)大于MAmax与ρ1的乘积,即MAmax
    (2)>MAmax×ρ1,则令MAmax=MAmax(2),Topt=T(2)。继续比较当
    前子帧在第三频率区域[320Hz,640Hz)内MCAMD序列最大值MAmax(3)与
    MAmax×ρ1,若MAmax(3)<MAmax×ρ1,则保持MAmax和Topt不变。继续比较
    第四频率区域为[640Hz,1280Hz]内MCAMD序列最大值MAmax(4)与MAmax
    ×ρ1,若MAmax(4)>MAmax×ρ1,则令MAmax=MAmax(4),Topt=T
    (4),......,此后继续比较,直至完成当前子帧在第五频率区域[1280Hz,
    4000Hz)内MCAMD序列最大值MAmax(5)和当前MAmax与ρ1的乘积的比较。
    比较结束后,第二中间变量Topt被赋予一个值,例如,当前子帧在第四频率区
    域[640Hz,1280Hz)内MCAMD序列最大值MAmax(4)对应的延迟T(4)。

    在本发明实施例中,第一经验因子ρ1可以取0.95。

    S102,计算所述第二中间变量Topt与所述当前子帧前奇数个子帧的基音周
    期估计中值Tpre_mid_o的比值,若所述比值小于第一校正因子或大于第二校正因
    子并且所述Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差序列最大
    值MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积,则用所述
    MAmax0对应的延迟T0校正第二中间变量Topt。

    若Topt被赋予一个值,例如,Topt=MAmax(4),则计算Topt/Tpre_mid_o。这
    里,Tpre_mid_o是当前子帧前奇数个子帧的基音周期估计中值。在本发明提供的
    实施例中,Tpre_mid_o取当前子帧前5个子帧的基音周期估计中值可以得到较好的
    估计结果。例如,假设当前子帧是子帧F8(F8的下标“8”表示子帧的编号,
    下同),记子帧F8前5个子帧依次为子帧F7、子帧F6、子帧F5、子帧F4和子帧F3,
    则子帧F8前5个子帧的基音周期估计中值是子帧F7、子帧F6、子帧F5、子帧F4
    和子帧F3的基音周期估计值经过中值滤波后得到,也是当前子帧前5个子帧中
    编号为中间值的子帧的基音周期估计值,即子帧F5的基音周期估计值。

    若所述比值小于第一校正因子或大于第二校正因子并且所述Tpre_mid_o邻近
    范围内所述当前子帧的修正循环平均幅度差序列最大值MAmax0大于所述第一
    中间变量MAmax与第二经验因子的乘积,则用所述MAmax0对应的延迟T0校正第
    二中间变量Topt;

    记第一校正因子、第二校正因子和第二经验因子分别为r1、r2和ρ2,若第
    二中间变量Topt与当前子帧前奇数个子帧的基音周期估计中值Tpre_mid_o的比值
    小于第一校正因子或大于第二校正因子,即,若Topt/Tpre_mid_o<r1或Topt
    /Tpre_mid_o>r2,则在Tpre_mid_o邻近范围内,例如,在Tpre_mid_o邻近1ms(毫秒)
    范围内寻找当前子帧的MCAMD序列最大值MAmax0。若Tpre_mid_o邻近范围内当
    前子帧的修正循环平均幅度差序列最大值MAmax0大于第一中间变量MAmax与
    第二经验因子的乘积,即,MAmax0>MAmax×ρ2,则第二中间变量Topt的当前
    值设置为Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差序列最大值
    MAmax0对应的延迟T0。

    S103,将所述当前子帧前偶数个子帧的基音周期估计值与第二中间变量
    Topt一起进行中值滤波,以进行所述中值滤波后得到的值作为中间子帧的基音
    周期估计值。

    中间子帧是当前子帧前偶数个子帧和当前子帧构成的若干子帧中子帧编
    号为中间值的子帧,而该偶数是小于步骤S102中的奇数的最大偶数。将当前子
    帧前偶数个子帧的基音周期估计值与第二中间变量Topt一起进行中值滤波,以
    进行所述中值滤波后得到的基音周期估计值作为中间子帧的基音周期估计值。

    例如,假设当前子帧是子帧F8,子帧F8前4个子帧即F7、子帧F6、子帧F5
    和子帧F4每一个子帧的基音周期估计值分别为T7、T6、T5和T4,则将Topt、T7、
    T6、T5和T4进行中值滤波,以进行所述中值滤波后得到的基音周期估计值作为
    中间子帧的基音周期估计值,即作为子帧F6的基音周期估计值。

    在本发明实施例中,第一校正因子r1、第二校正因子r2和第二经验因子ρ2
    分别可以取0.75、1.4和0.85。

    从上述本发明提供的实施例可知,由于修正循环平均幅度差序列是从具有
    良好周期性的归一化互相关序列推衍而得,处理修正循环平均幅度差序列最大
    值及其延迟值,通过循环比较各个基音频率区域内修正循环平均幅度差序列最
    大值与预设的MAmax的加权值,最终确定当前子帧的修正循环平均幅度差序列
    最大值及其延迟,可以降低归一化互相关序列算法估计基音周期时出现半频/
    倍频错误的概率,而用当前子帧修正循环平均幅度差序列得到的修正的基音延
    迟估计值,与当前子帧前偶数个子帧的基音周期估计值进行中值滤波,则可以
    进一步减少估算基音周期时出现的半频/倍频错误,相当于进一步提高了基音
    周期估计的准确度。

    以下结合附图2的流程,说明上述实施例中不满足某些假设条件时的技术
    方案,例如,假设步骤S101中,当前子帧在当前频率区域内MCAMD序列最大
    值MAmax(i+1)与MAmax的加权值的比较结果为MAmax(i+1)小于MAmax×ρ1。

    附图2实施例中,以将基音频率范围划分为5个频率区域为例说明。本领域
    技术人员能够理解,在将基音频率范围划分为其他数目的频率区域时,例如3
    个频率区域,处理的流程类似,因此不再赘述将基音频率范围划分为其他数目
    的频率区域时的处理流程。

    S201,令MAmax=MAmax(1),Topt=T(1),i=2。即将第一频率区域
    的MCAMD序列最大值和该最大值对应延迟作为预设初始值赋给第一中间变
    量MAmax和第二中间变量Topt,向前移动一个频率区域(i=2),即移动至第二
    频率区域。

    S202,MAmax(i)>MAmax×ρ1?即判断当前子帧在新的频率区域内
    MCAMD序列最大值是否大于第一经验因子与MAmax的乘积,若大于,则流程
    进入步骤S203,否则,流程进入步骤S204。

    S203,令MAmax=MAmax(i),Topt=T(i)。即在满足步骤S202条件时,
    第一中间变量MAmax和第二中间变量Topt分别使用当前子帧在新的频率区域内
    MCAMD序列的最大值及其延迟代替。

    S204,令i=i+1。即向前移动一个频率区域。

    S205,i>5?即判断当前频率区域是否在基音频率范围之内,或者
    当前频率区域是否是在基音频率范围内划分的5个频率区域内,若超出范围(即
    i>5),则流程进入步骤S206,否则重复上述过程,即回到步骤S202。

    S206,令r=Topt/Tpre_mid_o。即计算第二中间变量Topt与当前子帧前5个子帧
    的基音周期估计中值Tpre_mid_o的比值。

    S207,r<r1?或r>r2?即判断第二中间变量Topt与当前子帧前5
    个子帧的基音周期估计中值Tpre_mid_o的比值是否小于第一校正因子r1或是否大
    于第二校正因子r2。若是,则进入步骤S208,否则转入步骤S211。

    在本实施例中,r1和r2分别可以取0.75和1.4。

    S208,在Tpre_mid_o邻近范围内求取当前子帧的MCAMD序列最大值MAmax0
    及其延迟T0。例如,在Tpre_mid_o?1ms(毫秒)范围内求取当前子帧的MCAMD
    序列最大值MAmax0及其延迟T0。

    S209,MAmax0>MAmax×ρ2?即判断Tpre_mid_o邻近范围内当前子帧的
    MCAMD序列最大值MAmax0是否大于第一中间变量MAmax与第二经验因子ρ2
    的乘积。若是,则进入步骤S210,否则,转入步骤S211。

    S210,令Topt=T0。即使用Tpre_mid_o邻近范围内当前子帧的MCAMD序列
    最大值MAmax0对应的延迟T0校正第二中间变量Topt。

    S211,将当前子帧前偶数个子帧的基音周期估计值与第二中间变量Topt一
    起进行中值滤波。进行中值滤波后得到的基音周期估计值作为中间子帧的基音
    周期估计值。这里的中间子帧是当前子帧前偶数个子帧和当前子帧构成的若干
    子帧中子帧编号为中间值的子帧,例如,假设当前子帧是子帧F8,子帧F8前4
    个子帧是F7、子帧F6、子帧F5和子帧F4,则中间子帧是子帧F6。

    请参阅附图3,是本发明实施例提供的基音估计方法流程示意图,主要包
    括步骤:

    S301,对接收的信号进行预处理,所述信号包括语音信号或音频信号。

    由于真实的信号,例如,语音信号或音频信号常?;煸幼疟尘霸肷?、谐波
    以及共振峰频率等等,这些背景噪声和频率分量使得信号的波形变得非常复
    杂,这常常引起基音检测或估计的误判,为了在进行基音估计前尽可能去除这
    些不利因素,在本发明提供的实施例中,首先对接收的信号进行预处理。预处
    理包括对信号的静音帧和非静音帧进行判断。例如,由于语音或音频等信号的
    特征是随着时间而变化的,只有在一段时间间隔内,这些信号才保持相对稳定
    (平稳),信号的这种特性称为“短时性”。对语音或音频信号的分析和处理一
    般建立在“短时性”基础上,即对语音或音频信号流采用分段或分帧来处理。
    分帧一般采用可移动的有限长度窗口对语音或音频信号进行加权来实现。分帧
    既可以采用连续方式,也可以采用交叠分段的方法实现。因此,在本发明提供
    的实施例中,可以通过采用短时平均能量(窗口加权的短时平均能量相当于将
    “平方”信号通过一个线性滤波器的输出)来对信号的静音/非静音帧进行判
    断,即当信号的短时能量小于某个门限值时,判断为静音帧,否则为非静音帧。

    由于静音帧的周期不明显或者没有周期,对静音帧的基音周期进行估计往
    往与实际的基音周期偏离较大,从而影响对整个信号基音周期估计的准确性。
    鉴于上述原因,在本发明实施例中,对于信号的静音帧,不进行基音周期的估
    计和后处理过程。另外,在本发明实施例提供的基音估计方法中,为了适用于
    时间规整技术,将静音帧的基音周期设为前一子帧的基音中值而不是零,其原
    因在于,如果静音帧的基音周期设为零,则通过基音估计值提取的扭曲度(时
    间规整技术所需参数)在非静音帧和静音帧衔接点处会很大,导致错误的扭曲,
    进而影响使用本发明实施例提供的基音估计方法的时间规整技术性能。

    在对信号的静音帧和非静音帧进行判断之前,预处理还包括高通滤波、去
    均值和数值滤波。例如,可以采用下限频率为50Hz的高通滤波器对信号进行
    滤波,以去除电源信号的干扰??悸堑叫藕庞蟹橇憔凳?,归一化互相关序列
    在所有的延迟上均具有较高的数值,本发明实施例提供的预处理还包括去均值
    的过程,去均值之后的信号为s′(+)=s(n)-u,此处,为了对信号进
    行平滑,本发明实施例提供的预处理也包括采用一定阶数的滤波器对信号进行
    数值滤波。实践证明,在对信号进行数值滤波时,阶数低于5阶的滤波器效果
    不理想,高于5阶的滤波器效果提升不够明显,还带来较大的延迟。为了不引
    起延迟并得到较好的滤波效果,在本发明提供的实施例中,可以采用5阶数值
    滤波器对信号进行数值滤波,5阶数值滤波器的数值滤波公式为

    S302,对所述经过预处理的信号计算其归一化互相关序列,根据所述得到
    的归一化互相关序列求取所述归一化互相关序列的修正循环平均幅度差序列。

    由于互相关序列具有良好的周期性,因此,在本发明实施例中,可以通过
    计算归一化互相关函数,将经过预处理的信号转换成归一化互相关序列。例如,
    通过归一化互相关函数(NCCF,Normalized?Cross-Correlation?Function)将信
    号转换成归一化互相关序列R(j):

    R ( j ) = Σ n = 0 N - 1 s ~ ( n ) s ~ ( n - j ) Σ n = 0 N - 1 s ~ 2 ( n ) Σ n = 0 N - 1 s ~ 2 ( n - j ) , j = 0 , K , M ]]>

    其中,M为互相关时延长度,N为互相关序列长度。

    之后,对得到的归一化互相关(NCC,Normalized?Cross-Correlation)序
    列,计算其循环平均幅度差函数(CAMDF,Circular?Average?Magnitude?
    Difference?Function),将信号进一步转换成循环平均幅度差序列A(j):

    A ( j ) = 1 M Σ n = 0 M - 1 | R ( ( n + j ) mod M ) - R ( n ) | , j = 0 , K , M 2 ]]>

    进一步地,对循环平均幅度差(CAMD,Circular?Average?Magnitude?
    Difference)序列进行修正,求取NCC序列的修正循环平均幅度差(MCAMD,
    Modified?Circular?Average?Magnitude?Difference)序列M(j):

    MA ( j ) = A max - A ( j ) , j = 0 , K , M 2 , ]]>此处,Amax为A(j)序列的最大值。

    MA(j)的最大值对应的延迟是一个子帧(若将信号分成若干子帧进行分
    析)可能的基音周期估计值。

    如前所述,由于静音帧的周期不明显或者没有周期,对静音帧的基音周期
    进行估计往往与实际的基音周期偏离较大,从而影响对整个信号基音周期估计
    的准确性。因此,在本发明实施例中,对所述经过预处理的信号计算其归一化
    互相关序列,根据得到的归一化互相关序列求取所述归一化互相关序列的修正
    循环平均幅度差序列具体包括:对经过预处理的非静音帧信号计算其归一化互
    相关序列,根据得到的非静音帧信号的归一化互相关序列求取该非静音帧信号
    的归一化互相关序列的修正循环平均幅度差序列。

    S303,根据所述修正循环平均幅度差序列在基音频率范围内的最大值对应
    的延迟,对基音延迟估计值进行修正,以所述修正所得的延迟估计值为所述信
    号的基音周期估计值。

    记MCAMD序列最大值为MAmax(i),则在本发明实施例中,根据修正循
    环平均幅度差序列在基音频率范围内的最大值对应的延迟,对基音延迟估计值
    进行修正包括步骤S3031、S3032和S3033:

    S3031,比较当前子帧在当前频率区域内修正循环平均幅度差序列最大值
    MAmax(i+1)与第一中间变量MAmax的加权值,若所述MAmax(i+1)大于所述
    MAmax的加权值,则分别以所述MAmax(i+1)和所述MAmax(i+1)对应的延迟
    T(i+1)替代第一中间变量MAmax和第二中间变量Topt,重复所述比较过程,
    直至所述当前频率区域不在基音频率范围之内。

    这里的子帧可以是已经划分为16个子帧的一帧信号,例如,语音信号或音
    频信号,其16个子帧中的任何一个子帧,频率区域是在基音频率范围内划分的
    若干频率区间。例如,在80Hz~4000Hz之间的基音频率范围内划分成的五个
    频率区域:第一频率区域[80,160)Hz、第二频率区域[160,320)Hz、第三
    频率区域[320,640)Hz、第四频率区域[640,1280)Hz和第五频率区域[1280,
    4000)Hz。

    步骤S3031更详细的说明可参阅附图1示例的步骤S101的相关说明,此处不
    做赘述。

    S3032,计算第二中间变量Topt与当前子帧前奇数个子帧的基音周期估计中
    值Tpre_mid_o的比值。若第二中间变量Topt与当前子帧前奇数个子帧的基音周期估
    计中值Tpre_mid_o的比值小于第一校正因子或大于第二校正因子并且所述
    Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差序列最大值MAmax0大
    于所述第一中间变量MAmax与第二经验因子的乘积,则用所述MAmax0对应的延
    迟T0校正第二中间变量Topt。

    若Topt被赋予一个值,例如,Topt=MAmax(4),则计算Topt/Tpre_mid_o。这
    里,Tpre_mid_o是当前子帧前奇数个子帧的基音周期估计中值。在本发明提供的
    实施例中,Tpre_mid_o取当前子帧前5个子帧的基音周期估计中值可以得到较好的
    估计结果。例如,假设当前子帧是子帧F8(F8的下标“8”表示子帧的编号,
    下同),记子帧F8前5个子帧依次为子帧F7、子帧F6、子帧F5、子帧F4和子帧F3,
    则子帧F8前5个子帧的基音周期估计中值是子帧F7、子帧F6、子帧F5、子帧F4
    和子帧F3的基音周期估计值经过中值滤波后得到,也是当前子帧前5个子帧中
    编号为中间值的子帧的基音周期估计值,即子帧F5的基音周期估计值。

    在本实施例,第一校正因子r1、第二校正因子r2和第二经验因子ρ2分别可
    以取0.75、1.4和0.85。

    S3033,将所述当前子帧前偶数个子帧的基音周期估计值与第二中间变量
    Topt一起进行中值滤波,以进行所述中值滤波后得到的值作为中间子帧的基音
    周期估计值。

    步骤S3033更详细的说明可参阅附图1示例的步骤S103的相关说明,此处不
    做赘述。

    从附图3的示例可知,本发明是根据得到的归一化互相关序列求取归一化
    互相关序列的修正循环平均幅度差序列,进而根据所述修正循环平均幅度差序
    列在基音频率范围内的最大值对应的延迟,对基音延迟估计值进行修正,以所
    述修正所得的延迟估计值为所述信号的基音周期估计值。从总体上看,本发明
    实施例提供的基于归一化互相关加权修正循环平均幅度差函数的基音估计算
    法,与现有技术的时域基音估计算法相比具有较低时延,与频域算法相比计算
    复杂度低并且性能上相差不大。另一方面,由于修正循环平均幅度差序列是从
    具有良好周期性的归一化互相关序列推衍而得,因此可以降低归一化互相关序
    列算法估计基音周期时出现半频/倍频错误的概率,而根据所述修正循环平均
    幅度差序列在基音频率范围内的最大值对应的延迟,对基音延迟估计值进行修
    正(例如,用当前子帧修正循环平均幅度差序列得到的修正的基音延迟估计值,
    与当前子帧前偶数个子帧的基音周期估计值进行中值滤波)则可以进一步减少
    估算基音周期时出现的半频/倍频错误,相当于进一步提高了基音周期估计的
    准确度。

    请参阅附图4,是本发明实施例提供的一种基音周期估计值修正装置逻辑
    结构示意图。为了便于说明,仅仅示出了与本发明实施例相关的部分。附图4
    示例的基音周期估计值修正装置包含的功能???单元可以是软件???单元、
    硬件???单元或软硬件相结合???单元,包括比较???01、校正???02和
    中值滤波???03,其中:

    比较???01,用于比较当前子帧在当前频率区域内修正循环平均幅度差
    序列最大值MAmax(i+1)与第一中间变量MAmax的加权值,若所述MAmax(i+1)
    大于所述MAmax的加权值,则分别以所述MAmax(i+1)和所述MAmax(i+1)对
    应的延迟T(i+1)替代第一中间变量MAmax和第二中间变量Topt,重复所述比
    较过程,直至所述当前频率区域不在基音频率范围之内,所述第一中间变量
    MAmax的加权值是所述MAmax与第一经验因子的乘积,所述频率区域是在所述
    基音频率范围内划分的若干频率区间;

    校正???02,用于计算所述第二中间变量Topt与所述当前子帧前奇数个子
    帧的基音周期估计中值Tpre_mid_o的比值,若所述比值小于第一校正因子或大于
    第二校正因子并且所述Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度
    差序列最大值MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积,则
    用所述MAmax0对应的延迟T0校正第二中间变量Topt;

    所述用所述MAmax0应的延迟T0校正第二中间变量Topt是将第二中间变量
    Topt的当前值设置为所述MAmax0对应的延迟T0;

    中值滤波???03,用于将所述当前子帧前偶数个子帧的基音周期估计值
    与第二中间变量Topt进行中值滤波,以进行所述中值滤波后得到的值作为中间
    子帧的基音周期估计值;

    所述中间子帧是所述当前子帧的前偶数个子帧和所述当前子帧构成的若
    干子帧中子帧编号为中间值的子帧,所述偶数是小于所述奇数的最大偶数。

    需要说明的是,以上基音周期估计值修正装置的实施方式中,各功能???br />的划分仅是举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或
    者软件的实现的便利考虑,而将上述功能分配由不同的功能??橥瓿?,即将所
    述基音周期估计值修正装置的内部结构划分成不同的功能???,以完成以上描
    述的全部或者部分功能。而且,实际应用中,本实施例中的相应的功能??榭?br />以是由相应的硬件实现,也可以由相应的硬件执行相应的软件完成,例如,前
    述的校正??橹?,可以是具有执行前述计算第二中间变量Topt与当前子帧前奇
    数个子帧的基音周期估计中值Tpre_mid_o的比值的硬件,例如比值计算器,也可
    以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件
    设备;再如前述的中值滤波???,可以是具有执行前述将当前子帧前偶数个子
    帧的基音周期估计值与第二中间变量Topt进行中值滤波功能的硬件,如中值滤
    波器,也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者
    其他硬件设备。

    附图4示例的基音周期估计值修正装置中,基音频率范围可以为[80Hz,
    4000Hz),所述频率区域是在[80Hz,4000Hz)内划分的第一频率区域[80Hz,
    160Hz)、第二频率区域[160Hz,320Hz)、第三频率区域[320Hz,640Hz)、第
    四频率区域[640Hz,1280Hz)和第五频率区域[1280Hz,4000Hz)。此时,比
    较???01具体用于:预设第一中间变量MAmax值为当前子帧在[80Hz,160Hz)
    内修正循环平均幅度差序列最大值MAmax(1),预设第二中间变量Topt值为所
    述MAmax(1)对应的延迟T(1);比较当前子帧在[160Hz,320Hz)内修正循
    环平均幅度差序列最大值MAmax(2)与第一中间变量MAmax的加权值并对所述
    MAmax和所述Topt进行修正、比较当前子帧在[320Hz,640Hz)内修正循环平均
    幅度差序列最大值MAmax(3)与第一中间变量MAmax的加权值并对所述MAmax
    和所述Topt进行修正、比较当前子帧在[640Hz,1280Hz)内修正循环平均幅度
    差序列最大值MAmax(4)与第一中间变量MAmax的加权值并对所述MAmax和所
    述Topt进行修正,以及比较当前子帧在[1280Hz,4000Hz)内修正循环平均幅度
    差序列最大值MAmax(5)与第一中间变量MAmax的加权值并对所述MAmax和所
    述Topt进行修正。

    附图4示例的基音周期估计值修正装置中,当前子帧前奇数个子帧的基音
    周期估计中值Tpre_mid_o可以为所述当前子帧前5个子帧的基音周期估计中值
    Tpre_mid_o,Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度差序列最大值
    MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积为所述Tpre_mid_o邻
    近1毫秒范围内所述当前子帧的修正循环平均幅度差序列最大值MAmax0大于所
    述第一中间变量MAmax与第二经验因子的乘积。此时,校正???02具体用于
    计算所述第二中间变量Topt与所述当前子帧前5个子帧中编号为中间值的子帧
    的基音周期估计值的比值,若所述比值小于第一校正因子或大于第二校正因子
    并且所述Tpre_mid_o邻近1毫秒范围内所述当前子帧的修正循环平均幅度差序列
    最大值MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积,则将第二
    中间变量Topt的当前值设置所述MAmax0对应的延迟T0。

    附图4示例的基音周期估计值修正装置中,中值滤波???03具体用于将所
    述当前子帧前4个子帧的基音周期估计值Tpre_e与第二中间变量Topt进行中值滤
    波。

    请参阅附图5,是本发明实施例提供的一种基音估计装置逻辑结构示意图。
    为了便于说明,仅仅示出了与本发明实施例相关的部分。附图5示例的基音估
    计装置可以用于语音音频统一编码中的时间规整技术??橹?,也可以用于语音
    信号的基音估计,其包括预处理???01、序列求取???02和修正???03,
    其中:

    预处理???01,用于对接收的信号进行预处理,所述信号包括语音信号
    或音频信号;

    序列求取???02,用于对所述经过预处理的信号计算其归一化互相关序
    列,根据所述得到的归一化互相关序列求取所述归一化互相关序列的修正循环
    平均幅度差序列;

    修正???03,用于根据所述修正循环平均幅度差序列在基音频率范围内
    的最大值对应的延迟,对基音延迟估计值进行修正,以所述修正所得的延迟估
    计值为所述信号的基音周期估计值。

    附图5示例的预处理???01还可以包括判断单元601,如附图6示例的基音
    估计装置。判断单元601用于对接收的信号进行预处理后,对所述信号的静音
    帧和非静音帧进行判断,此时,序列求取???02具体用于对所述经过预处理
    的非静音帧信号计算其归一化互相关序列,根据所述得到的非静音帧信号的归
    一化互相关序列求取所述非静音帧信号的归一化互相关序列的修正循环平均
    幅度差序列。

    附图5或附图6示例的修正???03还可以包括比较单元701、校正单元702
    和中值滤波单元703,如附图7示例的基音估计装置,其中:

    比较单元701,用于比较当前子帧在当前频率区域内修正循环平均幅度差
    序列最大值MAmax(i+1)与第一中间变量MAmax的加权值,若所述MAmax(i+1)
    大于所述MAmax的加权值,则分别以所述MAmax(i+1)和所述MAmax(i+1)对
    应的延迟T(i+1)替代第一中间变量MAmax和第二中间变量Topt,重复所述比
    较过程,直至所述当前频率区域不在基音频率范围之内,所述第一中间变量
    MAmax的加权值是所述MAmax与第一经验因子的乘积,所述频率区域是在所述
    基音频率范围内划分的若干频率区间;

    校正单元702,用于计算所述第二中间变量Topt与所述当前子帧前奇数个子
    帧的基音周期估计中值Tpre?mid_o的比值,若所述比值小于第一校正因子或大于
    第二校正因子并且所述Tpre_mid_o邻近范围内所述当前子帧的修正循环平均幅度
    差序列最大值MAmax0大于所述第一中间变量MAmax与第二经验因子的乘积,则
    用所述MAmax0对应的延迟T0校正第二中间变量Topt;

    所述用所述MAmax0对应的延迟T0校正第二中间变量Topt是将第二中间变量
    Topt的当前值设置为所述MAmax0对应的延迟T0,

    中值滤波单元703,用于将所述当前子帧前偶数个子帧的基音周期估计值
    与第二中间变量Topt进行中值滤波,以进行所述中值滤波后得到的值作为中间
    子帧的基音周期估计值;

    所述中间子帧是所述当前子帧前偶数个子帧和所述当前子帧构成的若干
    子帧中子帧编号为中间值的子帧,所述偶数是小于所述奇数的最大偶数。

    需要说明的是,上述装置各???单元之间的信息交互、执行过程等内容,
    由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施
    例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

    附图8给出了附图5至附图7任一示例的基音估计装置用于语音音频统一编
    码的时间规整(TW,Time?Warp)技术??榈慕峁故疽馔?。附图8示例的语音
    音频统一编码的时间规整技术??榘ǎ盒睦砩Э刂颇??01、TW信息编码
    器803、TW信息解码器804、TW映射模型构建???05、比特输出???06、
    TW重采样???07、加窗映射???08、修正的离散余弦变换(Modified?Discrete?
    Cosine?Transform,MDCT)???09和附图5至附图7任一示例的基音估计装置
    802。

    在附图8示例的时间规整技术??橹?,若根据信号分类判别,判定使用频
    域编码方式进行编码,当编码器采用TW模式时,则将待编码信号分别送入心
    理声学控制???01、基音估计装置802和TW重采样???07。心理声学控制模
    块801提取信号的心理声学参数,用于辅助加窗映射???08中的窗型选择;基
    音估计装置802对信号的音调变化进行跟踪,提取基音信息,主要包括基音周
    期估计值(在本实施例中,基音周期可用于计算TW映射曲线参数信息);TW
    重采样???07完成待编码信号的时域重映射,以提高待编码信号在频域的频
    谱集中度。TW信息编码器803对输入的TW映射曲线参数信息进行编码量化并
    存储在码流中,而TW信息解码器804对编码量化后的TW映射曲线参数信息进
    行解码。本实施例中,使用解码后的TW映射曲线参数信息来构建TW映射模型,
    可以使编码与解码端的映射参数保持一致,从而可以在解码端根据该参数信息
    恢复出与编码端完全一致的映射曲线,避免因量化编码所带来的误差。解码后
    的TW映射曲线参数信息输入至TW映射模型构建???05。TW映射模型构建
    ???05根据解码后的TW映射曲线参数信息构建映射曲线,并计算时频变换操
    作所需的重采样和窗函数等控制信息。待编码信号经过TW重采样???07重采
    样和TW加窗映射???08加窗映射后,得到TW域信号,送入修正的离散余弦
    变换???09进行变换,从而得到TW-MDCT的系数。

    由于TW编码时,每帧需要16个基音信息来计算映射曲线,实现时每帧数
    据长度采用1024点时,即每隔64点输出一个基音数据?;舾倌?榈木咛迨?br />施方案为:采用128点的矩形窗,每次平移64点的方式进行基音周期估计,每
    帧数据计算16个基音值。

    附图9给出了附图5至附图7任一示例的基音估计装置用于语音信号的基音
    估计时,语音信号基音估计系统逻辑结构示意图。为了便于说明,仅仅示出了
    与本发明实施例相关的部分。附图9示例的语音信号基音估计系统包括预处理
    ???01、清音浊音判断???02、中心削波???03、基音周期置零???04、
    序列求取???05和修正???06,其中,预处理???01、序列求取???05
    和修正???06可以分别是附图5至附图7任一示例基音估计装置中的预处理模
    块、序列求取??楹托拚?椋?br />

    预处理???01,用于对输入的语音信号进行高通低通滤波、去均值和数
    值平滑等;

    清音浊音判断???02,用于根据短时能量和短时过零率判断经过预处理
    ???01处理的语音信号是浊音还是清音;

    中心削波???03,用于去除浊音信号中能量较小部分;

    基音周期置零???04,用于对清音信号的基音周期置零;

    序列求取???05,用于对经过所述中心削波???03处理的信号计算其归
    一化互相关序列,根据所述得到的归一化互相关序列求取所述归一化互相关序
    列的修正循环平均幅度差序列;

    修正???06,用于根据所述序列求取???05求取的修正循环平均幅度差
    序列在基音频率范围内的最大值对应的延迟,对基音延迟估计值进行修正,以
    所述修正所得的延迟估计值为所述信号的基音周期估计值。

    本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步
    骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读
    存储介质中,存储介质可以包括:只读存储器(ROM,Read?Only?Memory)、
    随机存取存储器(RAM,Random?Access?Memory)、磁盘或光盘等。

    以上对本发明实施例提供的基音周期估计值修正方法、基音估计方法和相
    关装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进
    行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;
    同时,对于本领域一般技术人员,依据本发明的思想,在具体实施方式及应用
    范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

    关于本文
    本文标题:基音周期估计值修正方法、基音估计方法和相关装置.pdf
    链接地址://www.4mum.com.cn/p-5870836.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 江西新时时开奖记录 山东十一选五稳赚技巧 极速时时基本走势图 重庆时时彩计划软件 大乐透电子走势图 免费时时彩龙虎计划 11选5任二稳赚技巧 11选5前2直选技巧 最精准七乐彩预测专家 七乐彩基本走势图分析 大乐透预测大乐透开奖 新龙虎下载平台 泡泡娱乐扎金花技巧规律 龙虎计划软件下载 怎样破解手机棋牌 排列三7码组选六最大遗漏