• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 33
    • 下载费用:30 金币  

    重庆时时彩头像: 音频信号质量检测方法及装置.pdf

    关 键 词:
    音频 信号 质量 检测 方法 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201310632876.3

    申请日:

    2013.11.29

    公开号:

    CN104681038A

    公开日:

    2015.06.03

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G10L 25/60申请日:20131129|||公开
    IPC分类号: G10L25/60(2013.01)I 主分类号: G10L25/60
    申请人: 清华大学; 华为软件技术有限公司
    发明人: 刘晓清; 贾珈; 蔡莲红; 王永鑫; 郝红霞
    地址: 100084北京市海淀区清华大学
    优先权:
    专利代理机构: 北京同立钧成知识产权代理有限公司11205 代理人: 刘芳
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201310632876.3

    授权公告号:

    ||||||

    法律状态公告日:

    2018.03.09|||2015.07.01|||2015.06.03

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明实施例提供一种音频信号质量检测方法及装置,该方法包括:获取待检测音频信号的频谱能量序列,频谱能量序列为N维向量,其中,N为对待检测音频信号进行加窗处理的窗函数的窗长,频谱能量序列内各元素用于表征各采样点的频谱能量;根据频谱能量序列,确定待检测音频信号中的低能子带;根据低能子带,判别待检测音频信号是否存在频带丢失,若确定待检测音频信号存在频带丢失,则确定待检测音频信号质量失真。本发明实施例对待检测音频信号的频谱进行分析,判别待检测音频信号是否存在频带丢失,进而确定待检测音频信号质量是否失真,从而无需与源音频信号进行比较即可获知待检测音频是否失真,实现音频信号质量的高效检测。

    权利要求书

    权利要求书
    1.  一种音频信号质量检测装置,其特征在于,包括:获取???、确定模 块和判断???,其中,
    所述获取???,用于获取待检测音频信号的频谱能量序列,所述频谱能 量序列为N维向量,其中,N为对所述待检测音频信号进行加窗处理的窗函 数的窗长,所述频谱能量序列内各元素用于表征各采样点的频谱能量;所述 确定???,用于根据所述获取??榛袢〉乃銎灯啄芰啃蛄?,确定所述待检 测音频信号中的低能子带;所述判断???,用于根据所述确定??槿范ǖ乃?述低能子带,判别所述待检测音频信号是否存在频带丢失,若确定所述待检 测音频信号存在频带丢失,则确定所述待检测音频信号质量失真。

    2.  根据权利要求1所述的装置,其特征在于,所述获取??榘ǎ?
    加窗单元,用于加窗处理所述待检测音频信号,得到加窗后的信号;
    转换单元,用于对所述加窗单元得到的所述加窗后的信号进行快速傅里 叶变换FFT,得到频域信号;
    运算单元,用于计算所述转换单元得到的所述频域信号的功率谱密度, 得到所述频谱能量序列。

    3.  根据权利要求2所述的装置,其特征在于,所述获取??榛拱ǎ?
    截取单元,用于截取所述转换单元得到的所述频域信号,得到短时频域 信号,所述短时频域信号为所述频域信号的前半部分或后半部分;
    则所述运算单元用于计算所述截取单元得到的所述短时频域信号的功率 谱密度,得到所述频谱能量序列。

    4.  根据权利要求3所述的装置,其特征在于,所述运算单元具体用于:
    根据如下公式计算所述截取单元得到的所述短时频域信号的功率谱密 度,得到所述频谱能量序列:
    P ( j ) = K × | S ( j ) | 2 , j = 1,2 , . . . , N 2 ]]>
    其中,S(j)为所述短时频域信号中的第j个点,P(j)为S(j)对应的功率谱 密度,K为窗函数参数,FS为信号采样率,ω(n)为窗函数;
    并根据如下公式得到所述频谱能量序列:

    其中,SP(j)为P(j)对应的频谱能量,为趋于零的正数。

    5.  根据权利要求4所述的装置,其特征在于,所述运算单元还用于:
    根据如下公式对所述频谱能量序列进行预设平滑步长的平滑处理:
    SP * ( j ) = 1 η × Σ i = j - η 2 j + ( η 2 - 1 ) [ SP ( i ) ] , j = 0,1 , . . . , N 2 ]]>
    其中,SP*(j)为平滑之后的频谱能量序列中的第j个点,η为所述预设平 滑步长,SP(i)为所述频谱能量序列中的第i个点;
    则所述确定??橛糜诟菟銎交蟮钠灯啄芰啃蛄?,确定所述待检 测音频信号中的低能子带。

    6.  根据权利要求1所述的装置,其特征在于,所述确定??榘ǎ?
    第一确定单元,用于根据所述获取??榛袢〉乃銎灯啄芰啃蛄兄械淖?大值和均值,确定低能判别阈值;
    第二确定单元,用于根据所述第一确定单元确定的所述低能判别阈值, 确定所述低能子带。

    7.  根据权利要求6所述的装置,其特征在于,所述第一确定单元具体用 于:
    根据如下公式确定所述低能判别阈值:
    σ = 1 , max < 4 0.5 × max , 0.75 × max mean max 0.3 × max , 0.5 × max mean < 0.75 × max 0.36 × max , 0.25 × max mean < 0.5 × max 0.3 × max , 0 mean < 0.25 × max max &GreaterEqual; 4 ]]>
    其中,σ为所述低能判别阈值,max为所述频谱能量序列中的最大值, mean为所述频谱能量序列中的均值。

    8.  根据权利要求6或7所述的装置,其特征在于,所述确定??榛拱ǎ?
    删除单元,用于若所述第二确定单元确定的所述低能子带的带宽小于第 一预设带宽,则删除所述低能子带;和/或,
    合并单元,用于若所述第二确定单元确定的相邻低能子带间的带宽间隔 小于第二预设带宽,则合并所述相邻低能子带。

    9.  根据权利要求6-8任一项所述的装置,其特征在于,所述确定??榛?包括:
    第三确定单元,用于分别对所述第二确定单元确定的所述低能子带的起 始点和结束点的邻域内所有点,确定所述起始点和结束点的拟合斜率;
    将所述起始点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的起始点;
    将所述结束点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的结束点。

    10.  根据权利要求9所述的装置,其特征在于,所述第三确定单元具体 用于:
    根据如下公式计算所述拟合斜率:
    S = M × Σ m = 1 M ( m × X m ) Σ m = 1 M ( M × Σ m = 1 M ( X m ) ) ]]>
    其中,S为所述拟合斜率,M为所述邻域内所有点的个数,Xm为所述邻 域内所有点的能量值。

    11.  根据权利要求1所述的装置,其特征在于,所述判断??榫咛逵糜冢?
    若所述确定??槿范ǖ乃龅湍茏哟拇硇∮诘谌ど璐?,则确定 所述待检测音频信号不存在频带丢失;或者,
    若所述确定??槿范ǖ乃龅湍茏哟目嫉愦笥谠ど杞缦拗?,则确定 所述待检测音频信号不存在频带丢失;或者,
    若采样率大于或等于预设采样率,且所述确定??槿范ǖ乃龅湍茏哟?的带宽大于第四预设带宽,则确定所述待检测音频信号存在频带丢失;或者,
    若所述确定??槿范ǖ乃龅湍茏哟钠鹗嫉愫徒崾愕哪夂闲甭实木?对值之和大于预设值,则确定所述待检测音频信号存在频带丢失。

    12.  根据权利要求11所述的装置,其特征在于,若所述确定??槿范ㄋ?述待检测音频信号存在频带丢失,则所述确定??榛褂糜冢?
    计算丢失频带中所有点的平均能量;
    若确定所述平均能量大于预设能量值,则判别所述待检测音频信号中所 丢失的频带中存在能量残留,并保存判别结果;或者,
    若确定所述平均能量小于或等于所述预设能量值,则判别所述待检测音 频信号中所丢失的频带中不存在能量残留,并保存判别结果。

    13.  根据权利要求1-12任一项所述的装置,其特征在于,所述装置还包 括:
    分帧???,用于对所述待检测音频信号进行预设帧长的分帧处理,得到 分帧后的音频信号;
    则所述获取??榫咛逵糜诨袢∷龇种∧?榈玫降乃龇种『蟮囊羝敌?号中各帧音频信号的频谱向量,并计算所述各帧音频信号的频谱向量的均值 序列;将所述均值序列作为所述待检测音频信号的频谱能量序列。

    14.  根据权利要求1-13任一项所述的装置,其特征在于,所述装置还包 括:
    滤除???,用于滤除所述待检测音频信号中直流分量,得到滤波后信号;
    则所述获取??橛糜诨袢∷雎瞬?榈玫降乃雎瞬ê笮藕诺钠灯啄?量序列。

    15.  根据权利要求14所述的装置,其特征在于,所述滤除??榫咛逵糜冢?
    根据如下公式滤除所述待检测音频信号中直流分量,得到滤波后信号:
    X * ( k ) = Σ β = k - N 1 2 k + N 1 2 [ h ( β - k + N 1 2 ) X ( k ) ] ]]>
    其中,X*(k)为所述滤波后信号,X(k)为所述待检测音频信号,h(τ)为滤 波器, h ( τ ) = sin [ ( τ - N 1 2 ) π ] - sin [ N 1 π 4 F S × ( τ - N 1 2 ) ] ( τ - N 1 2 ) π × ω 1 ( τ ) ( 1 - N 1 4 F S ) × ω 1 ( τ ) , τ = 0,1 , . . . , N 1 - 1 , ]]>ω1(τ)为 切比雪夫窗函数,N1为ω1(τ)的窗长。

    16.  一种音频信号质量检测方法,其特征在于,包括:
    获取待检测音频信号的频谱能量序列,所述频谱能量序列为N维向量, 其中,N为对所述待检测音频信号进行加窗处理的窗函数的窗长,所述频谱 能量序列内各元素用于表征各采样点的频谱能量;
    根据所述频谱能量序列,确定所述待检测音频信号中的低能子带;
    根据所述低能子带,判别所述待检测音频信号是否存在频带丢失,若确 定所述待检测音频信号存在频带丢失,则确定所述待检测音频信号质量失真。

    17.  根据权利要求16所述的方法,其特征在于,所述获取待检测音频信 号的频谱能量序列,包括:
    加窗处理所述待检测音频信号,得到加窗后的信号;
    对所述加窗后的信号进行快速傅里叶变换FFT,得到频域信号;
    计算所述频域信号的功率谱密度,得到所述频谱能量序列。

    18.  根据权利要求17所述的方法,其特征在于,所述对所述加窗后的信 号进行FFT,得到频域信号之后,所述方法还包括:
    获取短时频域信号,所述短时频域信号为所述频域信号的前半部分或后 半部分;
    则所述计算所述频域信号的功率谱密度,得到所述频谱能量序列,包括:
    计算所述短时频域信号的功率谱密度,得到所述频谱能量序列。

    19.  根据权利要求18所述的方法,其特征在于,所述计算所述短时频域 信号的功率谱密度,得到所述频谱能量序列,包括:
    根据如下公式计算所述短时频域信号的功率谱密度,得到所述频谱能量 序列:
    P ( j ) = K × | S ( j ) | 2 , j = 1,2 , . . . , N 2 ]]>
    其中,S(j)为所述短时频域信号中的第j个点,P(j)为S(j)对应的功率谱 密度,K为窗函数参数,FS为信号采样率,ω(n)为窗函数;
    并根据如下公式得到所述频谱能量序列:

    其中,SP(j)为P(j)对应的频谱能量,为趋于零的正数。

    20.  根据权利要求19所述的方法,其特征在于,所述计算所述短时频域 信号的功率谱密度,得到所述频谱能量序列,还包括:
    根据如下公式对所述频谱能量序列进行预设平滑步长的平滑处理:
    SP * ( j ) = 1 η × Σ i = j - η 2 j + ( η 2 - 1 ) [ SP ( i ) ] , j = 0,1 , . . . , N 2 ]]>
    其中,SP*(j)为平滑之后的频谱能量序列中的第j个点,η为所述预设平 滑步长,SP(i)为所述频谱能量序列中的第i个点;
    则所述根据所述频谱能量序列,确定所述待检测音频信号中的低能子带, 包括:
    根据所述平滑之后的频谱能量序列,确定所述待检测音频信号中的低能 子带。

    21.  根据权利要求16所述的方法,其特征在于,所述根据所述频谱能量 序列,确定所述待检测音频信号中的低能子带,包括:
    根据所述频谱能量序列中的最大值和均值,确定低能判别阈值;
    根据所述低能判别阈值,确定所述低能子带。

    22.  根据权利要求21所述的方法,其特征在于,所述根据所述频谱能量 序列中的最大值和均值,确定低能判别阈值,包括:
    根据如下公式确定所述低能判别阈值:
    σ = 1 , max < 4 0.5 × max , 0.75 × max mean max 0.3 × max , 0.5 × max mean < 0.75 × max 0.36 × max , 0.25 × max mean < 0.5 × max 0.3 × max , 0 mean < 0.25 × max max &GreaterEqual; 4 ]]>
    其中,σ为所述低能判别阈值,max为所述频谱能量序列中的最大值, mean为所述频谱能量序列中的均值。

    23.  根据权利要求21或22所述的方法,其特征在于,所述根据所述频 谱能量序列,确定所述待检测音频信号中的低能子带,还包括:
    若所述低能子带的带宽小于第一预设带宽,则删除所述低能子带;和/或,
    若相邻低能子带间的带宽间隔小于第二预设带宽,则合并所述相邻低能 子带。

    24.  根据权利要求21-23任一项所述的方法,其特征在于,所述根据所 述频谱能量序列,确定所述待检测音频信号中的低能子带,还包括:
    分别对所述低能子带的起始点和结束点的邻域内所有点,确定所述起始 点和结束点的拟合斜率;
    将所述起始点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的起始点;
    将所述结束点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的结束点。

    25.  根据权利要求24所述的方法,其特征在于,所述分别对所述低能子 带的起始点和结束点的邻域内所有点,确定所述起始点和结束点的拟合斜率, 包括:
    根据如下公式计算所述拟合斜率:
    S = M × Σ m = 1 M ( m × X m ) Σ m = 1 M ( M × Σ m = 1 M ( X m ) ) ]]>
    其中,S为所述拟合斜率,M为所述邻域内所有点的个数,Xm为所述邻 域内所有点的能量值。

    26.  根据权利要求16所述的方法,其特征在于,所述根据所述低能子带, 判别所述待检测音频信号是否存在频带丢失,包括:
    若所述低能子带的带宽小于第三预设带宽,则确定所述待检测音频信号 不存在频带丢失;或者,
    若所述低能子带的开始点大于预设界限值,则确定所述待检测音频信号 不存在频带丢失;或者,
    若采样率大于或等于预设采样率,且所述低能子带的带宽大于第四预设 带宽,则确定所述待检测音频信号存在频带丢失;或者,
    若所述低能子带的起始点和结束点的拟合斜率的绝对值之和大于预设 值,则确定所述待检测音频信号存在频带丢失。

    27.  根据权利要求26所述的方法,其特征在于,若确定所述待检测音频 信号存在频带丢失,则所述根据所述低能子带,判别所述待检测音频信号是 否存在频带丢失,还包括:
    计算丢失频带中所有点的平均能量;
    若确定所述平均能量大于预设能量值,则判别所述待检测音频信号中所 丢失的频带中存在能量残留,并保存判别结果;或者,
    若确定所述平均能量小于或等于所述预设能量值,则判别所述待检测音 频信号中所丢失的频带中不存在能量残留,并保存判别结果。

    28.  根据权利要求16-27任一项所述的方法,其特征在于,所述方法还 包括:
    对所述待检测音频信号进行预设帧长的分帧处理,得到分帧后的音频信 号;
    则所述获取待检测音频信号的频谱能量序列,包括:获取所述分帧后的 音频信号中各帧音频信号的频谱向量,并计算所述各帧音频信号的频谱向量 的均值序列;将所述均值序列作为所述待检测音频信号的频谱能量序列。

    29.  根据权利要求16-28任一项所述的方法,其特征在于,所述获取待 检测音频信号的频谱能量序列之前,所述方法还包括:
    滤除所述待检测音频信号中直流分量,得到滤波后信号;
    则所述获取待检测音频信号的频谱能量序列,包括:
    获取所述滤波后信号的频谱能量序列。

    30.  根据权利要求29所述的方法,其特征在于,所述滤除所述待检测音 频信号中直流分量,得到滤波后信号,包括:
    根据如下公式滤除所述待检测音频信号中直流分量,得到滤波后信号:
    X * ( k ) = Σ β = k - N 1 2 k + N 1 2 [ h ( β - k + N 1 2 ) X ( k ) ] ]]>
    其中,X*(k)为所述滤波后信号,X(k)为所述待检测音频信号,h(τ)为滤 波器, h ( τ ) = sin [ ( τ - N 1 2 ) π ] - sin [ N 1 π 4 F S × ( τ - N 1 2 ) ] ( τ - N 1 2 ) π × ω 1 ( τ ) ( 1 - N 1 4 F S ) × ω 1 ( τ ) , τ = 0,1 , . . . , N 1 - 1 , ]]>ω1(τ)为 切比雪夫窗函数,N1为ω1(τ)的窗长。

    说明书

    说明书音频信号质量检测方法及装置
    技术领域
    本发明实施例涉及移动通信技术,尤其涉及一种音频信号质量检测方法 及装置。
    背景技术
    目前运营商提供大量铃音给用户使用,在录制、编辑、存储和传输这些 铃音的过程中,可能导致铃音的某一个或者几个频带被滤除(即频带丢失), 从而低铃音的质量。另外,由于铃音的数据是海量的,对铃音质量进行人工 检测是无法完成的,因此,铃音质量检测引起普遍关注。
    现有技术通过用户终端拨打待检测的铃音,并录制该铃音的目标铃音文 件;利用主观语音质量评估(Perceptual Evaluation of Speech Quality,以下简 称:PESQ)算法对上述目标铃音文件和铃音平台上的源铃音文件进行对比, 输出人为评估分数(Man Option Score,以下简称:MOS)值,获得该铃音的 质量等级。
    上述铃音质量检测方法的实施过程中,需要存在铃音的源文件,若是用 户自制的铃音,则无法判别其音频质量。
    发明内容
    本发明实施例提供一种音频信号质量检测方法及装置,用于检测音频信 号中是否存在频带丢失,以判别音频信号的质量。
    第一方面,本发明实施例提供一种音频信号质量检测装置,包括:获取 ???、确定??楹团卸夏??,其中,
    所述获取???,用于获取待检测音频信号的频谱能量序列,所述频谱能 量序列为N维向量,其中,N为对所述待检测音频信号进行加窗处理的窗函 数的窗长,所述频谱能量序列内各元素用于表征各采样点的频谱能量;所述 确定???,用于根据所述获取??榛袢〉乃銎灯啄芰啃蛄?,确定所述待检 测音频信号中的低能子带;所述判断???,用于根据所述确定??槿范ǖ乃?述低能子带,判别所述待检测音频信号是否存在频带丢失,若确定所述待检 测音频信号存在频带丢失,则确定所述待检测音频信号质量失真。
    结合第一方面,在第一方面的第一种可能的实现方式中,所述获取???包括:
    加窗单元,用于加窗处理所述待检测音频信号,得到加窗后的信号;
    转换单元,用于对所述加窗单元得到的所述加窗后的信号进行快速傅里 叶变换FFT,得到频域信号;
    运算单元,用于计算所述转换单元得到的所述频域信号的功率谱密度, 得到所述频谱能量序列。
    结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实 现方式中,所述获取??榛拱ǎ?
    截取单元,用于截取所述转换单元得到的所述频域信号,得到短时频域 信号,所述短时频域信号为所述频域信号的前半部分或后半部分;
    则所述运算单元用于计算所述截取单元得到的所述短时频域信号的功率 谱密度,得到所述频谱能量序列。
    结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实 现方式中,所述运算单元具体用于:
    根据如下公式计算所述截取单元得到的所述短时频域信号的功率谱密 度,得到所述频谱能量序列:
    P ( j ) = K × | S ( j ) | 2 , j = 1,2 , . . . , N 2 ]]>
    其中,S(j)为所述短时频域信号中的第j个点,P(j)为S(j)对应的功率谱 密度,K为窗函数参数,FS为信号采样率,ω(n)为窗函数;
    并根据如下公式得到所述频谱能量序列:

    其中,SP(j)为P(j)对应的频谱能量,为趋于零的正数。
    结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实 现方式中,所述运算单元还用于:
    根据如下公式对所述频谱能量序列进行预设平滑步长的平滑处理:
    SP * ( j ) = 1 η × Σ i = j - η 2 j + ( η 2 - 1 ) [ SP ( i ) ] , j = 0,1 , . . . , N 2 ]]>
    其中,SP*(j)为平滑之后的频谱能量序列中的第j个点,η为所述预设平 滑步长,SP(i)为所述频谱能量序列中的第i个点;
    则所述确定??橛糜诟菟銎交蟮钠灯啄芰啃蛄?,确定所述待检 测音频信号中的低能子带。
    结合第一方面,在第一方面的第五种可能的实现方式中,所述确定???包括:
    第一确定单元,用于根据所述获取??榛袢〉乃銎灯啄芰啃蛄兄械淖?大值和均值,确定低能判别阈值;
    第二确定单元,用于根据所述第一确定单元确定的所述低能判别阈值, 确定所述低能子带。
    结合第一方面的第五种可能的实现方式,在第一方面的第六种可能的实 现方式中,所述第一确定单元具体用于:
    根据如下公式确定所述低能判别阈值:
    σ = 1 , max < 4 0.5 × max , 0.75 × max mean max 0.3 × max , 0.5 × max mean < 0.75 × max 0.36 × max , 0.25 × max mean < 0.5 × max 0.3 × max , 0 mean < 0.25 × max max &GreaterEqual; 4 ]]>
    其中,σ为所述低能判别阈值,max为所述频谱能量序列中的最大值, mean为所述频谱能量序列中的均值。
    结合第一方面的第五种或第六种可能的实现方式,在第一方面的第七种 可能的实现方式中,所述确定??榛拱ǎ?
    删除单元,用于若所述第二确定单元确定的所述低能子带的带宽小于第 一预设带宽,则删除所述低能子带;和/或,
    合并单元,用于若所述第二确定单元确定的相邻低能子带间的带宽间隔 小于第二预设带宽,则合并所述相邻低能子带。
    结合第一方面的第五种至第七种可能的实现方式中的任意一种,在第一 方面的第八种可能的实现方式中,所述确定??榛拱ǎ?
    第三确定单元,用于分别对所述第二确定单元确定的所述低能子带的起 始点和结束点的邻域内所有点,确定所述起始点和结束点的拟合斜率;
    将所述起始点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的起始点;
    将所述结束点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的结束点。
    结合第一方面的第八种可能的实现方式中的任意一种,在第一方面的第 九种可能的实现方式中,所述第三确定单元具体用于:
    根据如下公式计算所述拟合斜率:
    S = M × Σ m = 1 M ( m × X m ) Σ m = 1 M ( M × Σ m = 1 M ( X m ) ) ]]>
    其中,S为所述拟合斜率,M为所述邻域内所有点的个数,Xm为所述邻 域内所有点的能量值。
    结合第一方面,在第一方面的第十种可能的实现方式中,所述判断???具体用于:
    若所述确定??槿范ǖ乃龅湍茏哟拇硇∮诘谌ど璐?,则确定 所述待检测音频信号不存在频带丢失;或者,
    若所述确定??槿范ǖ乃龅湍茏哟目嫉愦笥谠ど杞缦拗?,则确定 所述待检测音频信号不存在频带丢失;或者,
    若采样率大于或等于预设采样率,且所述确定??槿范ǖ乃龅湍茏哟?的带宽大于第四预设带宽,则确定所述待检测音频信号存在频带丢失;或者,
    若所述确定??槿范ǖ乃龅湍茏哟钠鹗嫉愫徒崾愕哪夂闲甭实木?对值之和大于预设值,则确定所述待检测音频信号存在频带丢失。
    结合第一方面的第十种可能的实现方式,在第一方面的第十一种可能的 实现方式中,若所述确定??槿范ㄋ龃觳庖羝敌藕糯嬖谄荡?,则所 述确定??榛褂糜冢?
    计算丢失频带中所有点的平均能量;
    若确定所述平均能量大于预设能量值,则判别所述待检测音频信号中所 丢失的频带中存在能量残留,并保存判别结果;或者,
    若确定所述平均能量小于或等于所述预设能量值,则判别所述待检测音 频信号中所丢失的频带中不存在能量残留,并保存判别结果。
    结合第一方面、第一方面的第一种至第十一种可能的实现方式中的任意 一种,在第一方面的第十二种可能的实现方式中,所述装置还包括:
    分帧???,用于对所述待检测音频信号进行预设帧长的分帧处理,得到 分帧后的音频信号;
    则所述获取??榫咛逵糜诨袢∷龇种∧?榈玫降乃龇种『蟮囊羝敌?号中各帧音频信号的频谱向量,并计算所述各帧音频信号的频谱向量的均值 序列;将所述均值序列作为所述待检测音频信号的频谱能量序列。
    结合第一方面、第一方面的第一种至第十二种可能的实现方式中的任意 一种,在第一方面的第十三种可能的实现方式中,所述装置还包括:
    滤除???,用于滤除所述待检测音频信号中直流分量,得到滤波后信号;
    则所述获取??橛糜诨袢∷雎瞬?榈玫降乃雎瞬ê笮藕诺钠灯啄?量序列。
    结合第一方面的第十三种可能的实现方式,在第一方面的第十四种可能 的实现方式中,所述滤除??榫咛逵糜冢?
    根据如下公式滤除所述待检测音频信号中直流分量,得到滤波后信号:
    X * ( k ) = Σ β = k - N 1 2 k + N 1 2 [ h ( β - k + N 1 2 ) X ( k ) ] ]]>
    其中,X*(k)为所述滤波后信号,X(k)为所述待检测音频信号,h(τ)为滤 波器, h ( τ ) = sin [ ( τ - N 1 2 ) π ] - sin [ N 1 π 4 F S × ( τ - N 1 2 ) ] ( τ - N 1 2 ) π × ω 1 ( τ ) ( 1 - N 1 4 F S ) × ω 1 ( τ ) , τ = 0,1 , . . . , N 1 - 1 , ]]>ω1(τ)为 切比雪夫窗函数,N1为ω1(τ)的窗长。
    第二方面,本发明实施例提供一种音频信号质量检测方法,包括:
    获取待检测音频信号的频谱能量序列,所述频谱能量序列为N维向量, 其中,N为对所述待检测音频信号进行加窗处理的窗函数的窗长,所述频谱 能量序列内各元素用于表征各采样点的频谱能量;
    根据所述频谱能量序列,确定所述待检测音频信号中的低能子带;
    根据所述低能子带,判别所述待检测音频信号是否存在频带丢失,若确 定所述待检测音频信号存在频带丢失,则确定所述待检测音频信号质量失真。
    结合第二方面,在第二方面的第一种可能的实现方式中,所述获取待检 测音频信号的频谱能量序列,包括:
    加窗处理所述待检测音频信号,得到加窗后的信号;
    对所述加窗后的信号进行快速傅里叶变换FFT,得到频域信号;
    计算所述频域信号的功率谱密度,得到所述频谱能量序列。
    结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实 现方式中,所述对所述加窗后的信号进行FFT,得到频域信号之后,所述方 法还包括:
    获取短时频域信号,所述短时频域信号为所述频域信号的前半部分或后 半部分;
    则所述计算所述频域信号的功率谱密度,得到所述频谱能量序列,包括:
    计算所述短时频域信号的功率谱密度,得到所述频谱能量序列。
    结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实 现方式中,所述计算所述短时频域信号的功率谱密度,得到所述频谱能量序 列,包括:
    根据如下公式计算所述短时频域信号的功率谱密度,得到所述频谱能量 序列:
    P ( j ) = K × | S ( j ) | 2 , j = 1,2 , . . . , N 2 ]]>
    其中,S(j)为所述短时频域信号中的第j个点,P(j)为S(j)对应的功率谱 密度,K为窗函数参数,FS为信号采样率,ω(n)为窗函数;
    并根据如下公式得到所述频谱能量序列:

    其中,SP(j)为P(j)对应的频谱能量,为趋于零的正数。
    结合第二方面的第三种可能的实现方式,在第二方面的第四种可能的实 现方式中,所述计算所述短时频域信号的功率谱密度,得到所述频谱能量序 列,还包括:
    根据如下公式对所述频谱能量序列进行预设平滑步长的平滑处理:
    SP * ( j ) = 1 η × Σ i = j - η 2 j + ( η 2 - 1 ) [ SP ( i ) ] , j = 0,1 , . . . , N 2 ]]>
    其中,SP*(j)为平滑之后的频谱能量序列中的第j个点,η为所述预设平 滑步长,SP(i)为所述频谱能量序列中的第i个点;
    则所述根据所述频谱能量序列,确定所述待检测音频信号中的低能子带, 包括:
    根据所述平滑之后的频谱能量序列,确定所述待检测音频信号中的低能 子带。
    结合第二方面,在第二方面的第五种可能的实现方式中,所述根据所述 频谱能量序列,确定所述待检测音频信号中的低能子带,包括:
    根据所述频谱能量序列中的最大值和均值,确定低能判别阈值;
    根据所述低能判别阈值,确定所述低能子带。
    结合第二方面的第五种可能的实现方式,在第二方面的第六种可能的实 现方式中,所述根据所述频谱能量序列中的最大值和均值,确定低能判别阈 值,包括:
    根据如下公式确定所述低能判别阈值:
    σ = 1 , max < 4 0.5 × max , 0.75 × max mean max 0.3 × max , 0.5 × max mean < 0.75 × max 0.36 × max , 0.25 × max mean < 0.5 × max 0.3 × max , 0 mean < 0.25 × max max &GreaterEqual; 4 ]]>
    其中,σ为所述低能判别阈值,max为所述频谱能量序列中的最大值, mean为所述频谱能量序列中的均值。
    结合第二方面的第五种或第六种可能的实现方式,在第二方面的第七种 可能的实现方式中,所述根据所述频谱能量序列,确定所述待检测音频信号 中的低能子带,还包括:
    若所述低能子带的带宽小于第一预设带宽,则删除所述低能子带;和/或,
    若相邻低能子带间的带宽间隔小于第二预设带宽,则合并所述相邻低能 子带。
    结合第二方面的第五种至第七种可能的实现方式中的任意一种,在第二 方面的第八种可能的实现方式中,所述根据所述频谱能量序列,确定所述待 检测音频信号中的低能子带,还包括:
    分别对所述低能子带的起始点和结束点的邻域内所有点,确定所述起始 点和结束点的拟合斜率;
    将所述起始点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的起始点;
    将所述结束点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的结束点。
    结合第二方面的第八种可能的实现方式,在第二方面的第九种可能的实 现方式中,所述分别对所述低能子带的起始点和结束点的邻域内所有点,确 定所述起始点和结束点的拟合斜率,包括:
    根据如下公式计算所述拟合斜率:
    S = M × Σ m = 1 M ( m × X m ) Σ m = 1 M ( M × Σ m = 1 M ( X m ) ) ]]>
    其中,S为所述拟合斜率,M为所述邻域内所有点的个数,Xm为所述邻 域内所有点的能量值。
    结合第二方面,在第二方面的第十种可能的实现方式中,所述根据所述 低能子带,判别所述待检测音频信号是否存在频带丢失,包括:
    若所述低能子带的带宽小于第三预设带宽,则确定所述待检测音频信号 不存在频带丢失;或者,
    若所述低能子带的开始点大于预设界限值,则确定所述待检测音频信号 不存在频带丢失;或者,
    若采样率大于或等于预设采样率,且所述低能子带的带宽大于第四预设 带宽,则确定所述待检测音频信号存在频带丢失;或者,
    若所述低能子带的起始点和结束点的拟合斜率的绝对值之和大于预设 值,则确定所述待检测音频信号存在频带丢失。
    结合第二方面的第十种可能的实现方式,在第二方面的第十一种可能的 实现方式中,若确定所述待检测音频信号存在频带丢失,则所述根据所述低 能子带,判别所述待检测音频信号是否存在频带丢失,还包括:
    计算丢失频带中所有点的平均能量;
    若确定所述平均能量大于预设能量值,则判别所述待检测音频信号中所 丢失的频带中存在能量残留,并保存判别结果;或者,
    若确定所述平均能量小于或等于所述预设能量值,则判别所述待检测音 频信号中所丢失的频带中不存在能量残留,并保存判别结果。
    结合第二方面、第二方面的第一种至第十一种可能的实现方式中的任意 一种,在第二方面的第十二种可能的实现方式中,所述方法还包括:
    对所述待检测音频信号进行预设帧长的分帧处理,得到分帧后的音频信 号;
    则所述获取待检测音频信号的频谱能量序列,包括:获取所述分帧后的 音频信号中各帧音频信号的频谱向量,并计算所述各帧音频信号的频谱向量 的均值序列;将所述均值序列作为所述待检测音频信号的频谱能量序列。
    结合第二方面、第二方面的第一种至第十二种可能的实现方式中的任意 一种,在第二方面的第十三种可能的实现方式中,所述获取待检测音频信号 的频谱能量序列之前,所述方法还包括:
    滤除所述待检测音频信号中直流分量,得到滤波后信号;
    则所述获取待检测音频信号的频谱能量序列,包括:
    获取所述滤波后信号的频谱能量序列。
    结合第二方面的第十三种可能的实现方式,在第二方面的第十四种可能 的实现方式中,所述滤除所述待检测音频信号中直流分量,得到滤波后信号, 包括:
    根据如下公式滤除所述待检测音频信号中直流分量,得到滤波后信号:
    X * ( k ) = Σ β = k - N 1 2 k + N 1 2 [ h ( β - k + N 1 2 ) X ( k ) ] ]]>
    其中,X*(k)为所述滤波后信号,X(k)为所述待检测音频信号,h(τ)为滤 波器, h ( τ ) = sin [ ( τ - N 1 2 ) π ] - sin [ N 1 π 4 F S × ( τ - N 1 2 ) ] ( τ - N 1 2 ) π × ω 1 ( τ ) ( 1 - N 1 4 F S ) × ω 1 ( τ ) , τ = 0,1 , . . . , N 1 - 1 , ]]>ω1(τ)为 切比雪夫窗函数,N1为ω1(τ)的窗长。
    本发明实施例直接对待检测音频信号的频谱进行分析,根据待检测音频 信号的频谱能量序列,确定该待检测音频信号中包含的低能子带,并根据该 些低能子带,判别待检测音频信号是否存在频带丢失,进而确定所述待检测 音频信号质量是否失真,从而无需与源音频信号进行比较即可获知待检测音 频是否失真,实现音频信号质量的高效检测,并降低频带丢失的误判概率。
    附图说明
    为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下 面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在 不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
    图1为本发明音频信号质量检测装置实施例一的结构示意图;
    图2为四种窗函数的波形示例图;
    图3为汉明窗函数在时域上的幅值变化示例图;
    图4为汉明窗函数在频域上的频谱示例图;
    图5为音频信号中所丢失的频带中存在能量残留的示例图;
    图6为音频信号中所丢失的频带中不存在能量残留的示例图;
    图7为本发明音频信号质量检测装置实施例二的结构示意图;
    图8为本发明音频信号质量检测装置实施例三的结构示意图;
    图9为切比雪夫窗函数在时域上的幅值变化示例图;
    图10为切比雪夫窗函数在频域上的频谱示例图;
    图11为本发明音频信号质量检测装置实施例四中待检测音频信号的波 形示意图;
    图12为本发明音频信号质量检测装置实施例四中待检测音频信号滤波 之后的波形示意图;
    图13为本发明音频信号质量检测装置实施例四中待检测音频信号滤波 之后的频谱示意图;
    图14为本发明音频信号质量检测装置实施例四中待检测音频信号滤波 之后的频谱能量序列示意图;
    图15为本发明音频信号质量检测方法实施例一的流程示意图;
    图16为本发明音频信号质量检测方法实施例二的流程示意图。
    具体实施方式
    为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发 明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述, 显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例?;?本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获 得的所有其他实施例,都属于本发明?;さ姆段?。
    图1为本发明音频信号质量检测装置实施例一的结构示意图。本发明实 施例提供了一种音频信号质量检测装置,该装置可以集成在终端设备中,其 中,终端设备可以为个人电脑(Personal Computer,以下简称:PC)或平板 电脑等任意终端设备。如图1所示,本实施例的装置包括:获取???0、确 定???0和判断???0。
    其中,获取???0用于获取待检测音频信号的频谱能量序列,该频谱能 量序列为N维向量,其中,N为对上述待检测音频信号进行加窗处理的窗函 数的窗长,该频谱能量序列内各元素用于表征各采样点的频谱能量;确定模 块20用于根据获取???0获取的上述频谱能量序列,确定上述待检测音频 信号中的低能子带;判断???0用于根据确定???0确定的上述低能子带, 判别上述待检测音频信号是否存在频带丢失,若确定所述待检测音频信号存 在频带丢失,则确定所述待检测音频信号质量失真。
    上述待检测音频信号可以为一般的音频文件,也可以为运营商提供给用 户的彩铃、振铃或全曲等特色音乐。另外,本发明不仅可以应用于一般音乐 质量的检测,对于语音和其他传输数字信号都有着很好的扩展应用。
    频谱是时域的信号在频域下表示方式,可以针对信号进行傅立叶变换而 得。频谱可以表示一个信号是由哪些频率的弦波所组成,音频可以由许多不 同频率的音频组成。
    对音频信号进行加窗处理,也就是一次仅处理音频信号位于窗内的数据。 因为实际场景中音频信号较长,本发明采用对待检测的音频信号加窗处理的 方式进行分析,避免对长数据的一次性处理。通常情况下,音频信号没有明 显的周期性,加窗处理后,音频信号的数据形状就会呈现周期性。在上述待 检测的音频信号自身较短的场景中,可以不对其进行上述加窗处理,直接求 得该待检测的音频信号的频谱能量序列,此时,N为该待检测音频信号的总 采样点个数。
    其中,窗函数类型可以为以下任意一种:矩型窗函数、汉明窗函数、汉 宁窗函数或布莱克曼窗函数等。上述四种窗函数的波形图如图2所示:N表 示一个周期内的采样点个数,ω(n)表示各窗函数对应的波形值,①表示矩形 窗函数的波形;②表示汉宁窗函数的波形;③表示汉明窗函数的波形;④表 示布莱克曼窗函数的波形。该四种窗函数的特征见表1。
    表1窗函数特征
    窗函数 主瓣宽度 旁瓣峰值衰减(dB) 阻带最小衰减(dB) 矩形窗函数 4π/N -13 -21 汉宁窗函数 8π/N -31 -44 汉明窗函数 8π/N -41 -53 布莱克曼窗函数 12π/N -57 -74
    窗函数在某一数值区间内为非零值,而在其余数值区间内皆为0。以汉 明窗函数为例进行说明,汉明窗函数主要部分的形状像sin(x)在0到π区 间的形状,而其余部分都是0,这样,汉明窗函数与其他任何一个函数的乘 积只有一部分有非零值。
    本发明以汉明窗函数为例,说明该窗函数在一个周期内对应的时域波形 和频域波形,其中,图3为汉明窗函数在时域上的幅值变化示例图,图4为 汉明窗函数在频域上的频谱示例图。图4中,横轴表示采样点,纵轴表示各 采样点对应的归一化幅值。图4中,横轴表示归一化频率,该归一化频率为 每个采样点的实际频率与π相除获得;纵轴表示每个采样点对应的频谱能量, 其单位为分贝。
    加窗处理待检测音频信号之后,待检测音频信号位于窗函数中间的数据 保留,位于窗函数两侧的数据丢失,因此,移动窗函数时,移动步长通常为 1/3或1/2窗长,这样,被前一帧或二帧丢失的数据又重新得到了体现。对待 检测音频信号自身或加窗处理后的待检测音频信号进行快速傅里叶变换(Fast  Fourier Transformation,以下简称:FFT)即得到待检测音频信号的频域信息, 求得该频域信息的功率谱密度作为待检测音频信号的频谱,并根据该频谱计 算频谱能量,得到上述频谱能量序列。
    对获得的频谱能量序列,若其中某一点的频谱能量低于预设的低能判别 阈值,则将其标注为低能点。对于频谱能量序列上的第i,i+1点为低能点, 且i-1点不为低能点,则将i标注为低能子带的开始点;若第i,i-1点为低能 点,且i+1点不为低能点,则将i标注为低能子带的结束点,从而得到频谱能 量序列中所有的低能子带及其边界特征,该边界特征包括边界点的位置及边 界点的拟合斜率等。
    根据上述低能子带,判别上述待检测音频信号是否存在频带丢失,例如, 若低能子带的带宽小于第一预设数值,则认为待检测音频信号不存在频带丢 失;若低能子带的带宽大于第二预设数值,则认为待检测音频信号存在频带 丢失,其中,该第二预设数值大于该第一预设数值。若待检测音频信号存在 频带丢失,则确定该待检测音频信号质量失真,并输出所丢失频带的起始频 率和结束频率;对不存在频带丢失的待检测音频信号,则确定该待检测音频 信号质量正常。
    本发明实施例直接对待检测音频信号的频谱进行分析,根据待检测音频 信号的频谱能量序列,确定该待检测音频信号中包含的低能子带,并根据该 些低能子带,判别待检测音频信号是否存在频带丢失,进而确定所述待检测 音频信号质量是否失真,从而无需与源音频信号进行比较即可获知待检测音 频是否失真,实现音频信号质量的高效检测,并降低频带丢失的误判概率。
    具体地,获取???0可以包括:加窗单元,用于加窗处理所述待检测音 频信号,得到加窗后的信号;转换单元,用于对所述加窗单元得到的所述加 窗后的信号进行FFT,得到频域信号;运算单元,用于计算所述转换单元得 到的所述频域信号的功率谱密度,得到所述频谱能量序列。
    其中,对加窗后的信号,求得其FFT后的频域信号,该计算过程如下:
    X [ m ] = Σ k = 0 N 2 - 1 x [ k ] W N mk + Σ k = N 2 N - 1 x [ k ] W N mk ]]>
    = Σ k = 0 N 2 - 1 x [ k ] W N mk + Σ k = 0 N 2 - 1 x [ k + N 2 ] W N m ( k + N 2 ) - - - ( 1 ) ]]>
    = Σ k = 0 N 2 - 1 ( x [ k ] + ( - 1 ) m x [ k + N 2 ] ) W N mk ]]>
    其中,X[m]为频域信号,x[k]为加窗后的 信号。
    X [ 2 r ] = Σ k = 0 N 2 - 1 ( x [ k ] + x [ k + N 2 ] ) W N / 2 mk - - - ( 2 ) ]]>
    X [ 2 r + 1 ] = Σ k = 0 N 2 - 1 ( x [ k ] - x [ k + N 2 ] ) W N k W N / 2 mk - - - ( 3 ) ]]>
    由上述公式(1)可知,对所述加窗后的信号进行FFT,其中,FFT长度 为上述待检测音频信号的长度,得到频域信号为对称序列,因此,取该频域 信号的半边S(j),例如,S(j)采用如公式(2)或公式(3)所表达的频域信 号,其中,即可表达该加窗后的信号的频域信息,得到该加窗 后的信号对应的短时频域信号,从而减小上述运算单元的计算量。
    因此,在上述基础上,获取???0还可以包括截取单元,该截取单元用 于截取所述转换单元得到的所述频域信号,得到短时频域信号,所述短时频 域信号为所述频域信号的前半部分或后半部分;则所述运算单元用于计算所 述截取单元得到的所述短时频域信号的功率谱密度,得到所述频谱能量序列。
    进一步地,运算单元可以具体用于根据如下公式(4)计算所述截取单元 得到的所述短时频域信号的功率谱密度,得到所述频谱能量序列:
    P ( j ) = K × | S ( j ) | 2 , j = 1,2 , . . . , N 2 - - - ( 4 ) ]]>
    其中,S(j)为所述短时频域信号中的第j个点,P(j)为S(j)对应的功率谱 密度,K为窗函数参数,FS为信号采样率,ω(n)为窗函数;
    并根据如下公式(5)得到所述频谱能量序列:

    其中,SP(j)为P(j)对应的频谱能量,为趋于零的正数??梢晕缓?小的数值,用于避免根据公式(5)计算频谱能量出现负无穷和很小的负值, 保证计算结果的有效性。
    对于采样率为FS的待检测音频信号,其频谱上频率范围为其中, SP(0)对应待检测音频信号的直流分量,SP(j)中的每一点对应待检测音频信 号频谱上每一段的频谱能量,即SP(j)为待检测音频信号从至子带 内的频谱能量。
    上述运算单元还可以用于:根据如下公式(6)对所述频谱能量序列进行 预设平滑步长的平滑处理:
    SP * ( j ) = 1 η × Σ i = j - η 2 j + ( η 2 - 1 ) [ SP ( i ) ] , j = 0,1 , . . . , N 2 - - - ( 6 ) ]]>
    其中,SP*(j)为平滑之后的频谱能量序列中的第j个点,η为所述预设平 滑步长,SP(i)为所述频谱能量序列中的第i个点。预设平滑步长可以根据实 际需求进行设置,例如可以为40。
    根据上述平滑处理后的频谱能量序列,确定???0可以用于根据所述平 滑之后的频谱能量序列,确定所述待检测音频信号中的低能子带。本发明实 施例对频谱能量序列进行平滑处理,使得频谱能量序列的精细结构被平滑, 使得频谱能量序列中的尖峰和峡谷都趋于圆滑。
    确定???0可以具体包括:第一确定单元和第二确定单元,该第一确定 单元用于根据所述获取??榛袢〉乃銎灯啄芰啃蛄兄械淖畲笾岛途?,确 定低能判别阈值;该第二确定单元用于根据所述第一确定单元确定的所述低 能判别阈值,确定所述低能子带。
    其中,第一确定单元可以具体用于根据如下公式(7)确定所述低能判别 阈值:
    σ = 1 , max < 4 0.5 × max , 0.75 × max mean max 0.3 × max , 0.5 × max mean < 0.75 × max 0.36 × max , 0.25 × max mean < 0.5 × max 0.3 × max , 0 mean < 0.25 × max max &GreaterEqual; 4 - - - ( 7 ) ]]>
    其中,σ为所述低能判别阈值,max为所述频谱能量序列中的最大值, mean为频谱能量序列中的均值。
    由公式(7)可知,当max小于4时,σ取值为1;当max大于或等于4 时,σ根据max和mean的上述大小关系进行取值,此处不再一一赘述。需要 说明的是,公式(7)是依据大量的实验数据所得。
    在上述实施例的基础上,确定???0还可以包括:删除单元,该删除单 元用于若所述第二确定单元确定的所述低能子带的带宽小于第一预设带宽, 则删除所述低能子带;和/或,合并单元,用于若所述第二确定单元确定的相 邻低能子带间的带宽间隔小于第二预设带宽,则合并所述相邻低能子带,以 进一步减小计算复杂度及判断次数。其中,上述第一预设带宽和第二预设带 宽可以根据实际需求进行设置,例如,第一预设带宽可以为200赫兹(Hz), 第二预设带宽可以为400Hz,等等。
    进一步地,确定???0还可以包括:第三确定单元,该第三确定单元用 于分别对所述第二确定单元确定的所述低能子带的起始点和结束点的邻域内 所有点,确定所述起始点和结束点的拟合斜率;将所述起始点的拟合斜率中 的最大绝对值对应的点重新定位为所述低能子带的起始点;将所述结束点的 拟合斜率中的最大绝对值对应的点重新定位为所述低能子带的结束点。
    具体地,第三确定单元可以具体用于根据如下公式(8)计算所述拟合斜 率:
    S = M × Σ m = 1 M ( m × X m ) Σ m = 1 M ( M × Σ m = 1 M ( X m ) ) - - - ( 8 ) ]]>
    其中,S为所述拟合斜率,M为所述邻域内所有点的个数,Xm为所述邻 域内所有点的能量值。
    本发明实施例中,在合并单元和/或删除单元对上述低能子带进行过滤 (该过滤可省略)之后,对于每个低能子带的开始点和结束点的附近的领域 内的所有点,计算低能子带的边界点的拟合斜率,从而增加对上述待检测音 频信号中是否存在频带丢失的判决条件,进而保证待检测音频信号中频带丢 失判断的准确度。
    在上述基础上,判断???0可以具体用于:若确定???0确定的所述 低能子带的带宽小于第三预设带宽,则确定所述待检测音频信号不存在频带 丢失;或者,若确定???0确定的所述低能子带的开始点大于预设界限值, 则确定所述待检测音频信号不存在频带丢失;或者,若采样率大于或等于预 设采样率,且确定???0确定的所述低能子带的带宽大于第四预设带宽,则 确定所述待检测音频信号存在频带丢失;或者,若确定???0确定的所述低 能子带的起始点和结束点的拟合斜率的绝对值之和大于预设值,则确定所述 待检测音频信号存在频带丢失。
    其中,上述第三预设带宽可以为300Hz或上述待检测音频信号的频带(即 采样率的一半)的二十分之一;上述预设界限值可以为19千赫兹(KHz); 若上述采样率为22KHz,则上述第四预设带宽为上述待检测音频信号的频带 的三分之一;上述预设值可以为0.08,即低能子带的边界处能量变化非???, 是被滤除的,所以应该为频带丢失。
    另需说明的是,若确定???0确定上述待检测音频信号存在频带丢失, 则确定???0还可以用于计算丢失频带中所有点的平均能量;若确定该平均 能量大于预设能量值,则判别上述待检测音频信号中所丢失的频带中存在能 量残留,并保存判别结果;或者,若确定该平均能量小于或等于上述预设能 量值,则判别上述待检测音频信号中所丢失的频带中不存在能量残留,并保 存判别结果。对于待检测音频信号中所丢失频带存在能量残留的情况,用户 可以主观判断该待检测音频信号失真;对于待检测音频信号中所丢失频带不 存在能量残留的情况,用户不能主观判断该待检测音频信号失真,需采用本 发明实施例提供的音频质量检测方法进行判断。因此,本发明实施例提供的 音频信号质量检测方法实现音频信号质量的高效检测,降低频带丢失的误判 概率。
    对于存在频带丢失的音频信号,计算丢失频带中所有点的平均能量,用 于判别音频信号中所丢失的频带中是否有能量残留,保存判别结果。例如将 判别结果保存在参数频带滤除判别结果freLostType中,若该平均能量大于 1.2,则判别为存在能量残留freLostType=2,例如图5所示;否则,判别 为不存在能量残留,freLostType=1,例如图6所示;对于不存在频带缺失 的音频,freLostType=0。
    还需说明的是,本发明任意实施例中,所有的预设数值均可以根据实际 需求进行设置,本发明中出现的具体数值只为方便说明为准,不对其实际大 小进行限制。
    图7为本发明音频信号质量检测装置实施例二的结构示意图。该实施例 在如图1所示的实施例的基础上,音频信号质量检测装置还可以包括:分帧 ???0,用于对上述待检测音频信号进行预设帧长的分帧处理,得到分帧后 的音频信号;则获取???0可以具体用于获取分帧???0得到的所述分帧 后的音频信号中各帧音频信号的频谱向量,并计算所述各帧音频信号的频谱 向量的均值序列;将所述均值序列作为所述待检测音频信号的频谱能量序列。
    本实施例中,先将待检测音频信号分帧,预设帧长可以根据需求设置, 在分帧过程中,若最后一帧信号的长度不满足预设帧长,则对其进行补零, 使得每帧的长度达到预设帧长。例如,预设帧长可以为2048点,帧移为1024 点,最后一帧若不满2048点,则补零至一个预设帧长。此时,获取???0 在获取频谱能量序列时,需计算所述分帧后的音频信号中各帧音频信号的频 谱向量,并根据公式(9)计算所述各帧音频信号的频谱向量的均值序列:
    SP ( j ) = 1 M 1 Σ t = 1 M 1 [ FP ( t , j ) ] - - - ( 9 ) ]]>
    其中,FP(t,j)表示第t帧音频信号的频谱向量,M1为时域上的帧数。
    公式(9)是在根据公式(5)计算得到每一帧音频信号的频谱向量的基 础上,对各帧音频信号的频谱向量在时域上求均值,得到频谱能量序列???选地,还可以首先对分帧后的音频信号通过上述加窗单元进行加窗处理,然 后再通过转换单元和运算单元得到频谱能量序列。
    更进一步地,如图8所示,音频信号质量检测装置还可以包括:滤除模 块50,用于滤除所述待检测音频信号中直流分量,得到滤波后信号;则获取 ???0用于获取该滤波???0得到的所述滤波后信号的频谱能量序列。
    具体地,滤除??榭梢跃咛逵糜诟萑缦鹿剑?0)滤除所述待检测音 频信号中直流分量,得到滤波后信号:
    X * ( k ) = Σ β = k - N 1 2 k + N 1 2 [ h ( β - k + N 1 2 ) X ( k ) ] - - - ( 10 ) ]]>
    其中,X*(k)为所述滤波后信号,X(k)为所述待检测音频信号,h(τ)为滤 波器, h ( τ ) = sin [ ( τ - N 1 2 ) π ] - sin [ N 1 π 4 F S × ( τ - N 1 2 ) ] ( τ - N 1 2 ) π × ω 1 ( τ ) ( 1 - N 1 4 F S ) × ω 1 ( τ ) , τ = 0,1 , . . . , N 1 - 1 , ]]>ω1(τ)为 切比雪夫窗函数,N1为ω1(τ)的窗长。
    音频信号在录制、存储和编辑过程均可能引入直流分量,而直流分量会 干扰音频信号自身的短时能量和频谱的计算。因此,本发明实施例对待检测 音频信号进行滤波处理,从而提高音频信号频谱和短时能量的精确度。另外, 由于音频信号在50赫兹(Hz)以下的信息都极少,对听感几乎没有影响,且 滤除后不干扰音频信号的质量,也不影响音频信号的进一步检测,因此,可 选地,滤除50Hz以下的频带,以降低计算复杂度。
    滤除??椴捎们斜妊┓虼昂瞬ㄆ鳎–hebyshev Window Function  Filter),可以很好的滤除50Hz以下的子带,并且获得很窄的50HZ左右的过 度频带。切比雪夫窗函数在时域和频域上的图形示例图如图9和图10所示。
    以下通过几组实验数据说明采用本发明实施例提供的音频信号质量检测 装置对音频信号质量的检测结果:
    第一组:对中间子带缺失的音频信号进行检测,其中,在266个音频信 号中有250正常的音频信号和16个含有中间频带缺失的音频信号,一共含有 26个中间频带缺失。检测结果为96.3%的召回率,86.5%的准确率;
    第二组:对于高频缺失的音频信号进行检测,在297个音频信号中有234 个音频信号含有高频缺失,其他的为正常音频信号。检测结果为97.4%的召 回率,100%的准确率;
    第三组:对所有种类的频带缺失进行了检测,在2654个音频信号中,共 包含各类子带缺失332个。检测结果为93.8%的召回率,96.3%的准确率。
    综合上述实验结果可知,本发明实施例提供的音频信号质量检测装置可 以有效的检测出待检测音频信号中存在的频带丢失,且具有较高的准确率和 召回率。
    采用如图8所示的音频信号质量检测装置,检测一时长为60秒的待检测 音频信号,采样率为44.1KHz,待检测音频信号波形如图11所示,其中,横 轴为时间,单位为秒;纵轴为各采样点的幅值大小。
    由图11可见,波形中间存在较强的直流分量,且待检测音频波形整体向 上偏移,因此,首先通过切比雪夫窗函数进行高通滤波,将直流分量滤除。 滤波之后的结果如图12所示,其中,横轴为时间,单位为秒;纵轴为各采样 点的幅值大小。由图12可见,直流分量被滤除,待检测音频信号波形整体以 0值基准线上下对称;计算滤波后信号的频谱,所得频谱如图13所示。
    然后,计算该频谱在时域上均值,得到频谱能量序列,如图14所示;根 据确定???0可以检测到该待检测音频信号中存在三个低能子带,参考图 14,分别为:(2052Hz,4850Hz),(9560Hz,10050Hz)和(16000Hz, 22050Hz),计算上述三个低能子带的起始点和结束点的拟合斜率,分别为 (-1.25,2.25),(-0.75,056),(-0.15,0)。
    最后,判断???0根据上述三个低能子带,对该待检测音频信号是否存 在频带丢失进行判别:对于第三个低能子带,由于是高频子带,所以只考虑 其起始点的拟合斜率,其斜率为-0.15,小于低能判别阈值,因此,确定第三 个低能子带为正常子带,即单独从第三个低能子带看,该待检测音频信号质 量正常;第二个低能子带的带宽为490Hz,小于该待检测音频信号带宽的二 十分之一(1000Hz),因此,确定第二个低能子带为正常子带,即单独从第 二个低能子带看,该待检测音频信号质量正常;第一个低能子带的带宽为2850 Hz,大于该待检测音频信号带宽的二十分之一,且该第一个低能子带为中间 子带,另外,该第一个低能子带的起始点和结束点的拟合斜率绝对值之和大 于低能判别阈值,因此,确定第一个低能子带为异常子带,即从第一个低能 子带看,该待检测音频信号质量失真。
    从上述分析结果可知,本发明实施例提供的音频信号质量检测装置可以 有效的检测出待检测音频信号中存在的频带丢失。
    图15为本发明音频信号质量检测方法实施例一的流程示意图。本发明实 施例提供一种音频信号质量检测方法,该方法可以通过上述实施例中的音频 信号质量检测装置执行。如图15所示,该方法包括:
    S151、获取待检测音频信号的频谱能量序列。
    具体地,该频谱能量序列为N维向量,其中,N为对上述待检测音频信 号进行加窗处理的窗函数的窗长,该频谱能量序列内各元素用于表征各采样 点的频谱能量。
    S152、根据上述频谱能量序列,确定该待检测音频信号中的低能子带。
    S153、根据上述低能子带,判别该待检测音频信号是否存在频带丢失, 若确定该待检测音频信号存在频带丢失,则确定该待检测音频信号质量失真。
    本实施例的方法,可以由图1所示的音频信号质量检测装置执行,各步 骤作用可以参考上述音频信号质量检测装置实施例中对应部件的功能,其实 现原理和技术效果类似,此处不再赘述。
    其中,上述获取待检测音频信号的频谱能量序列可以具体包括:加窗处 理上述待检测音频信号,得到加窗后的信号;对该加窗后的信号进行FFT, 得到频域信号;计算该频域信号的功率谱密度,得到上述频谱能量序列。
    在上述基础上,上述对加窗后的信号进行FFT,得到频域信号之后,音 频信号质量检测方法还可以包括:获取短时频域信号,该短时频域信号为上 述频域信号的前半部分或后半部分;则上述计算频域信号的功率谱密度,得 到频谱能量序列,包括:计算该短时频域信号的功率谱密度,得到频谱能量 序列。
    其中,计算短时频域信号的功率谱密度,得到频谱能量序列可以具体包 括:根据如下公式计算短时频域信号的功率谱密度,得到频谱能量序列:
    P ( j ) = K × | S ( j ) | 2 , j = 1,2 , . . . , N 2 ]]>
    其中,S(j)为短时频域信号中的第j个点,P(j)为S(j)对应的功率谱密度, K为窗函数参数,FS为信号采样率,ω(n)为窗函数;
    并根据如下公式得到频谱能量序列:

    其中,SP(j)为P(j)对应的频谱能量,为趋于零的正数。
    可选地,上述计算短时频域信号的功率谱密度,得到频谱能量序列,还 可以包括:根据如下公式对频谱能量序列进行预设平滑步长的平滑处理:
    SP * ( j ) = 1 η × Σ i = j - η 2 j + ( η 2 - 1 ) [ SP ( i ) ] , j = 0,1 , . . . , N 2 ]]>
    其中,SP*(j)为平滑之后的频谱能量序列中的第j个点,η为预设平滑步 长,SP(i)为所述频谱能量序列中的第i个点。则根据所述频谱能量序列,确 定待检测音频信号中的低能子带,包括:根据该平滑之后的频谱能量序列, 确定上述待检测音频信号中的低能子带。
    上述根据频谱能量序列,确定待检测音频信号中的低能子带具体可以包 括:根据频谱能量序列中的最大值和均值,确定低能判别阈值;根据该低能 判别阈值,确定低能子带。
    具体地,根据频谱能量序列中的最大值和均值,确定低能判别阈值,包 括:根据如下公式确定低能判别阈值:
    σ = 1 , max < 4 0.5 × max , 0.75 × max mean max 0.3 × max , 0.5 × max mean < 0.75 × max 0.36 × max , 0.25 × max mean < 0.5 × max 0.3 × max , 0 mean < 0.25 × max max &GreaterEqual; 4 ]]>
    其中,σ为低能判别阈值,max为频谱能量序列中的最大值,mean为频 谱能量序列中的均值。
    可选地,根据频谱能量序列,确定待检测音频信号中的低能子带,还可 以包括:若低能子带的带宽小于第一预设带宽,则删除该低能子带;和/或, 若相邻低能子带间的带宽间隔小于第二预设带宽,则合并该相邻低能子带。
    进一步地,根据频谱能量序列,确定待检测音频信号中的低能子带,还 可以包括:分别对低能子带的起始点和结束点的邻域内所有点,确定起始点 和结束点的拟合斜率;将起始点的拟合斜率中的最大绝对值对应的点重新定 位为低能子带的起始点;将结束点的拟合斜率中的最大绝对值对应的点重新 定位为低能子带的结束点。
    需要说明的是,分别对低能子带的起始点和结束点的邻域内所有点,确 定起始点和结束点的拟合斜率,可以包括:根据如下公式计算拟合斜率:
    S = M × Σ m = 1 M ( m × X m ) Σ m = 1 M ( M × Σ m = 1 M ( X m ) ) ]]>
    其中,S为拟合斜率,M为邻域内所有点的个数,Xm为邻域内所有点的 能量值。
    上述根据低能子带,判别待检测音频信号是否存在频带丢失,具体可以 包括:若低能子带的带宽小于第三预设带宽,则确定待检测音频信号不存在 频带丢失;或者,若低能子带的开始点大于预设界限值,则确定待检测音频 信号不存在频带丢失;或者,若采样率大于或等于预设采样率,且低能子带 的带宽大于第四预设带宽,则确定待检测音频信号存在频带丢失;或者,若 低能子带的起始点和结束点的拟合斜率的绝对值之和大于预设值,则确定待 检测音频信号存在频带丢失。
    在上述基础上,若确定待检测音频信号存在频带丢失,则根据低能子带, 判别待检测音频信号是否存在频带丢失,还可以包括:计算丢失频带中所有 点的平均能量;若确定该平均能量大于预设能量值,则判别待检测音频信号 中所丢失的频带中存在能量残留,并保存判别结果;或者,若确定该平均能 量小于或等于预设能量值,则判别待检测音频信号中所丢失的频带中不存在 能量残留,并保存判别结果。
    图16为本发明音频信号质量检测方法实施例二的流程示意图。如图16 所示,本实施例在图15所示实施例的基础上,音频质量检测方法还可以包括:
    S161、滤除待检测音频信号中直流分量,得到滤波后信号。
    具体地,根据如下公式滤除待检测音频信号中直流分量,得到滤波后信 号:
    X * ( k ) = Σ β = k - N 1 2 k + N 1 2 [ h ( β - k + N 1 2 ) X ( k ) ] ]]>
    其中,X*(k)为滤波后信号,X(k)为待检测音频信号,h(τ)为滤波器, h ( τ ) = sin [ ( τ - N 1 2 ) π ] - sin [ N 1 π 4 F S × ( τ - N 1 2 ) ] ( τ - N 1 2 ) π × ω 1 ( τ ) ( 1 - N 1 4 F S ) × ω 1 ( τ ) , τ = 0,1 , . . . , N 1 - 1 , ]]>ω1(τ)为切比 雪夫窗函数,N1为ω1(τ)的窗长。
    S162、对滤波后信号进行预设帧长的分帧处理,得到分帧后的音频信号。
    S163、获取分帧后的音频信号的频谱能量序列。
    具体地,获取分帧后的音频信号中各帧音频信号的频谱向量,并计算各 帧音频信号的频谱向量的均值序列;将该均值序列作为待检测音频信号的频 谱能量序列。
    该步骤的详细说明可参考S151,此处不再赘述。
    S164和S165同上述实施例中S152和S153,此处不再赘述。
    本发明实施例直接对待检测音频信号的频谱进行分析,根据待检测音频 信号的频谱能量序列,确定该待检测音频信号中包含的低能子带,并根据该 些低能子带的带宽或边界特征等属性,判别待检测音频信号是否存在频带丢 失,进而确定所述待检测音频信号质量是否失真,从而无需与源音频信号进 行比较即可获知待检测音频是否失真,实现音频信号质量的高效检测,并降 低频带丢失的误判概率。
    本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步 骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可 读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而 前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码 的介质。
    最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对 其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通 技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改, 或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并 不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

    关于本文
    本文标题:音频信号质量检测方法及装置.pdf
    链接地址://www.4mum.com.cn/p-5887114.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 3d组选051 青海11选5开奖结果今天 青海十一选五今天开奖结果 河南十一选五走势图百度彩票 股票配资排名丿选 极速飞艇投注网站 广东快中彩开奖记录 棋牌10元可提现的棋牌 甘肃11选5开奘结果 九乐棋牌破解版下载 000006股票行情 幸运农场计划稳定版 4月河北11选5开奖结果 体彩新疆11选5走势图 天天棋盘 11选5软件