• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 24
    • 下载费用:30 金币  

    重庆时时彩10元提现: 立体声编码的方法、装置.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201310270930.4

    申请日:

    2010.02.12

    公开号:

    CN103366748A

    公开日:

    2013.10.23

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情: 发明专利申请公布后的撤回IPC(主分类):G10L 19/008申请公布日:20131023|||实质审查的生效IPC(主分类):G10L 19/008申请日:20100212|||公开
    IPC分类号: G10L19/008(2013.01)I; G10L19/06(2013.01)I; G10L19/22(2013.01)I 主分类号: G10L19/008
    申请人: 华为技术有限公司
    发明人: 吴文海; 苗磊; 郎玥; 张琦
    地址: 518129 广东省深圳市龙岗区坂田华为总部办公楼
    优先权:
    专利代理机构: 代理人:
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201310270930.4

    授权公告号:

    ||||||

    法律状态公告日:

    2015.01.21|||2013.11.20|||2013.10.23

    法律状态类型:

    发明专利申请公布后的撤回|||实质审查的生效|||公开

    摘要

    本发明实施例涉及一种立体声编码的方法,变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号;频域上的左声道信号和右声道信号经过下混生成单声道下混信号,传送所述下混信号进行编码量化后的比特;提取频域上左声道信号和右声道信号的空间参数;利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位;量化编码所述群延时和群相位以及所述空间参数以得到低码率下优质的立体声编码性能。

    权利要求书

    权利要求书
    1.  一种立体声编码的方法,其特征在于,所述方法包括:
    变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号;
    频域上的左声道信号和右声道信号经过下混生成单声道下混信号,传送所述下混信号进行编码量化后的比特;
    提取频域上左声道信号和右声道信号的空间参数;
    利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位;
    量化编码所述群延时和群相位以及所述空间参数。

    2.  如权利要求1所述的方法,其特征在于:所述利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位之前包括确定关于频域上立体声左右声道信号间的互相关函数,所述互相关函数包括频域上左声道信号与右声道信号的共轭的乘积的加权的互相关。

    3.  如权利要求2所述的方法,其特征在于:频域立体声左右声道信号间的加权的互相关可以表示为:
    Cr(k)=X1(k)X2*(k)/|X1(k)||X2(k)|k=02*X1(k)X2*(k)/|X1(k)||X2(k)|1kN/2-1X1(k)X2*(k)/|X1(k)||X2(k)|k=N/20k>N/2,]]>
    Cr(k)=X1(k)X2*(k)/X1(k)2+X2(k)2k=02*X1(k)X2*(k)/X1(k)2+X2(k)21kN/2-1X1(k)X2*(k)/X1(k)2+X2(k)2k=N/20k>N/2]]>
    其中,N为立体声信号时频变换的长度,|X1(k)|和|X2(k)|为X1(k)和 X2(k)对应的幅度,X1(k)为频域上的立体声左声道信号,X2(k)为频域上的立体声右声道信号;加权的所述互相关函数在频点0,频点N/2上的值为左右声道信号在对应频点上幅度乘积的倒数,加权的所述互相关函数在其他频点上为左右声道信号的幅度积的倒数的2倍。

    4.  如权利要求3所述的方法,其特征在于:所述方法还包括对所述互相关函数进行逆时频变换得到互相关函数时域信号,
    或对所述互相关函数进行逆时频变换得到互相关函数时域信号,对所述时域信号进行预处理。

    5.  如权利要求4所述的方法,其特征在于:根据互相关函数时域信号,所述利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位,包括:
    根据互相关函数时域信号或基于处理后的互相关函数时域信号中幅度最大的值对应的索引估计得到群延时,获得群延时对应的互相关函数对应的相角,估计得到群相位。

    6.  如权利要求3所述的方法,其特征在于:根据所述互相关函数,所述利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位,包括:
    提取所述互相关函数的相位,根据相位差和变换长度的乘积与频率信息的比值关系确定群延时;
    根据加权的互相关函数当前频点的相位与频点索引和相位差均值乘积的差值得到群相位信息。

    7.  如权利要求5或6所述的方法,其特征在于,所述方法还包括根据所述群相位和群延时估计得到立体声分带信息,量化编码所述分带信息,所述分带信息包括:左右声道间的相位差参数,互相关参数和/或 左声道与下混信号的相位差参数。

    8.  一种估计立体声信号的方法,其特征在于,所述方法包括:
    确定关于频域立体声左右声道信号间的加权的互相关函数;
    对所述加权互相关函数进行预处理;
    根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位。

    9.  如权利要求8所述的方法,其特征在于:频域立体声左右声道信号的加权的互相关函数可以表示为:
    Cr(k)=X1(k)X2*(k)/|X1(k)||X2(k)|k=02*X1(k)X2*(k)/|X1(k)||X2(k)|1kN/2-1X1(k)X2*(k)/|X1(k)||X2(k)|k=N/20k>N/2]]>
    Cr(k)=X1(k)X2*(k)/X1(k)2+X2(k)2k=02*X1(k)X2*(k)/X1(k)2+X2(k)21kN/2-1X1(k)X2*(k)/X1(k)2+X2(k)2k=N/20k>N/2]]>
    其中,N为立体声信号时频变换的长度,|X1(k)|和|X2(k)|为X1(k)和X2(k)对应的幅度,X1(k)为频域上的立体声左声道信号,X2(k)为频域上的立体声右声道信号;所述加权的互相关函数在频点0,频点N/2上的值为左右声道信号在对应频点上幅度乘积的倒数,所述加权的互相关函数在其他频点上为左右声道信号的幅度积的倒数的2倍。

    10.  如权利要求9所述的方法,其特征在于,所述方法还包括:对关于频域立体声左右声道信号的加权的互相关函数进行逆时频变换得到互相关函数时域信号。

    11.  如权利要求10所述的方法,其特征在于,对所述互相关函数时域信号进行预处理包括对互相关函数时域信号进行归一化处理和平滑 处理得到处理后的互相关函数时域信号Cravg(n),其中所述平滑处理包括:
    Cravg(n)=α*Cravg(n)+β*Cr(n),
    或者对所述互相关函数时域信号的绝对值信号进行归一化处理和平滑处理得到处理后的互相关函数时域信号Cravg_abs(n),其中所述平滑处理包括:
    Cravg_abs(n)=α*Cravg(n)+β*|Cr(n)|;
    α和β是加权的常数,0≤α≤1,β=1-α,Cr(n)是互相关函数时域信号。

    12.  如权利要求11所述的方法,其特征在于,根据预处理结果估计得到立体声信号的群延时以及群相位包括:
    判断互相关函数时域信号中幅度最大的值对应的索引和与立体声信号时频变换长度N相关的对称区间的关系,如果互相关函数时域信号中幅度最大的值对应的索引位于第一对称区间[0,m],那么群延时等于该互相关函数时域信号中幅度最大的值对应的索引,如果相关函数中幅度最大的值对应的索引位于第二对称区间(N-m,N],群延时为该索引减去N;m小于等于N/2;
    根据群延时对应的互相关函数对应的相角,当群延时dg大于等于零,通过确定dg对应的互相关值对应的相角估计得到群相位;当dg小于零时,群相位为dg+N索引上对应的互相关值对应的相角。

    13.  如权利要求12所述的方法,其特征在于,根据预处理结果估计得到立体声信号的群延时以及群相位包括:
    群延时dg=argmax|Cravg(n)|argmax|Cravg(n)|N/2argmax|Cravg(n)|-Nargmax|Cravg(n)|>N/2,]]>
    群相位θg=&angle;Cravg(dg)dg&GreaterEqual;0&angle;Cravg(dg+N)dg<0,]]>
    其中,N为立体声信号时频变换的长度,argmax|Cravg(n)|是Cravg(n)中幅度最大的值对应的索引,∠Cravg(dg)为互相关函数值Cravg(dg)的相角,∠Cravg(dg+N)为互相关函数值Cravg(dg+N)的相角。

    14.  如权利要求8所述的方法,其特征在于,根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位包括:
    对所述互相关函数,或基于处理后的互相关函数,提取其
    相位,其中函数∠Cr(k用于提取复数Cr(k)的相角;
    在低带一个频率内求取相位差的均值α1,根据相位差和变换长度的乘积与频率信息的比值关系确定群延时,根据所述互相关函数当前频点的相位与频点索引和相位差均值乘积的差值得到群相位。

    15.  如权利要求14所述的方法,其特征在于,根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位包括:
    α1=E{Φ^(k+1)-Φ^(k)}k<Max;]]>
    dg=-a1N2*π*Fs;]]>
    θg=E{Φ^(k)-a1*k}k<Max,]]>
    其中表示相位差的均值,Fs为采用的频率,Max为计算群延时和群相位的截止上限,防止相位旋转,dg为群延时,θg为群相位,N为立体声信号时频变换的长度。

    16.  一种估计立体声信号的装置,其特征在于,所述装置包括:
    加权互相关单元,用于确定关于频域立体声左右声道信号间的加权的互相关函数;
    预处理单元,用于对所述加权的互相关函数进行预处理;
    估计单元,根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位。

    17.  如权利要求16所述的装置,其特征在于,所述装置还包括:
    频时变换单元,对关于频域立体声左右声道信号的加权的互相关函数进行逆时频变换得到互相关函数时域信号。

    18.  如权利要求17所述的装置,其特征在于,所述根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位的估计单元包括:
    判断单元,用于判断互相关函数时域信号中幅度最大的值对应的索引和与立体声信号时频变换长度N相关的对称区间的关系;
    群延时单元,如果互相关函数时域信号中幅度最大的值对应的索引位于第一对称区间[0,m],那么群延时等于该互相关函数时域信号中幅度最大的值对应的索引,如果相关函数中幅度最大的值对应的索引位于第二对称区间(N-m,N],群延时为该索引减去N;m小于等于N/2;
    群相位单元,用于根据群延时对应的互相关函数对应的相角,当群延时dg大于等于零,通过确定dg对应的互相关值对应的相角估计得到群相位;当dg小于零时,群相位为dg+N索引上对应的互相关值对应的相角。

    19.  如权利要求16所述的装置,其特征在于,所述根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位的估计单元包括:
    相位提取单元,用于对所述互相关函数,或基于处理后的互相关函数,提取其相位,其中函数∠Cr(k)用于提取复数Cr(k)的相 角;
    群延时单元,用于在低带一个频率内求取相位差的均值α1,根据相位差和变换长度的乘积与频率信息的比值关系确定群延时;
    群相位单元,用于根据所述互相关函数当前频点的相位与频点索引和相位差均值乘积的差值得到群相位信息。

    20.  如权利要求16所述的装置,其特征在于,所述装置还包括参数特性单元,用于根据所述群相位和群延时估计得到立体声参数IPD。

    21.  一种立体声信号编码的设备,其特征在于,所述设备包括:
    变换装置,用于变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号;
    下混装置,用于频域上的左声道信号和右声道信号经过下混生成单声道下混信号;
    参数提取装置,用于提取频域上左声道信号和右声道信号的空间参数;
    估计立体声信号装置,用于利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位;
    编码装置,用于量化编码所述群延时和群相位,所述空间参数和所述单声道下混信号。

    22.  如权利要求21所述的设备,其特征在于:所述估计立体声信号装置利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位之前还包括确定关于频域上立体声左右声道信号间的互相关函数,所述互相关函数包括频域上左声道信号与右声道信号的共轭的乘积的加权的互相关。

    23.  如权利要求20或22所述的设备,其特征在于:所述估计立体 声信号装置确定的关于频域上立体声左右声道信号间的加权的互相关函数可以表示为:
    Cr(k)=X1(k)X2*(k)/|X1(k)||X2(k)|k=02*X1(k)X2*(k)/|X1(k)||X2(k)|1kN/2-1X1(k)X2*(k)/|X1(k)||X2(k)|k=N/20k>N/2,]]>
    Cr(k)=X1(k)X2*(k)/X1(k)2+X2(k)2k=02*X1(k)X2*(k)/X1(k)2+X2(k)21kN/2-1X1(k)X2*(k)/X1(k)2+X2(k)2k=N/20k>N/2]]>
    其中,N为立体声信号时频变换的长度,|X1(k)|和|X2(k)|为X1(k)和X2(k)对应的幅度,X1(k)为频域上的立体声左声道信号,X2(k)为频域上的立体声右声道信号;加权的所述互相关函数在频点0,频点N/2上的值为左右声道信号在对应频点上幅度乘积的倒数,加权的所述互相关函数在其他频点上为左右声道信号的幅度积的倒数的2倍。

    24.  如权利要求23所述的装置,其特征在于:所述估计立体声信号装置包括频时变换单元,用于对所述互相关函数进行逆时频变换得到互相关函数的时域信号。

    25.  如权利要求24所述的装置,其特征在于:所述估计立体声信号装置包括估计单元,用于根据互相关函数时域信号或基于处理后的互相关函数时域信号中幅度最大的值对应的索引估计得到群延时,获得群延时对应的互相关函数对应的相角,估计得到群相位。

    26.  如权利要求24所述的装置,其特征在于:所述估计立体声信号装置包括估计单元,用于提取所述互相关函数的相位,根据相位差和变换长度的乘积与频率信息的比值关系确定群延时;根据互相关函数当前频点的相位与频点索引和相位差均值乘积的差值得到群相位信息。

    27.  一种立体声编码的系统,其特征在于,所述系统包括如权利要求21-26任一所述的立体声编码设备、接收设备以及传送设备,接收设备用于接收立体声输入信号用于立体声编码设备;传送设备52,用于传送所述立体声编码设备51的结果。

    说明书

    说明书立体声编码的方法、装置
    技术领域
    本发明实施例涉及多媒体领域,尤其涉及一种立体声处理技术,具体为立体声编码的方法、装置。
    背景技术
    现有的立体声编码方法,有强度立体声,BCC(Binaual Cure Coding)和PS(Parametric-Stereo coding)编码方法,通常情况,采用强度编码需要提取左右声道间的能量比ILD(InterChannel Level Difference)参数,将ILD参数作为边信息进行编码,并优先传送到解码端以帮助恢复立体声信号。ILD是个普遍存在并反映声场信号的信号特性参数,ILD能对声场能量较好的体现,然而立体声往往存在背景空间和左右方向的声场,仅采用传送ILD恢复还原立体声的方式已经不能满足恢复原始立体声信号的要求,于是提出了传送更多参数以更好恢复立体声信号的方案,除了提取最基本的ILD参数外,还提出传送左右声道的相位差(IPD:InterChannel Phase Difference)及左右声道的互相关ICC参数,有时也会包含左声道与下混信号的相位差(OPD)参数,将这些反应立体声信号背景空间和左右方向声场信息的参数和ILD参数共同作为边信息进行编码并发送到解码端以还原立体声信号。
    编码码率是多媒体信号编码性能的重要评判因素之一,对低码率的采用是业界共同追求的目标,现有的立体声编码技术在传送ILD的同时传送LPD、ICC和OPD参数势必需要提高编码码率,因为LPD、ICC以及 OPD参数都是信号的局部特性参数,用于反应立体声信号的分带信息,编码立体声信号的LPD、ICC以及OPD参数,需要对立体声信号的每一个分带编码LPD、ICC以及OPD参数,对立体声信号的每一个分带而言,每个分带IPD编码需要多个比特,每个分带ICC编码需要多个比特,依此类推,则立体声编码参数需要大量的比特数才能增强声场的信息,在较低码率要求下则只能增强部分分带,达不到逼真还原的效果,导致低码率下恢复出的立体声信息和原输入信号之间有较大的差距,从听觉效果来说,会给收听者带来极不舒适的听觉感受。
    发明内容
    本发明实施例提供一种立体声编码方法、装置和系统,增强低码率下声场信息,提升编码效率。
    本发明实施例提供了一种立体声编码的方法,所述方法包括:
    变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号;频域上的左声道信号和右声道信号经过下混生成单声道下混信号,传送所述下混信号进行编码量化后的比特;提取频域上左声道信号和右声道信号的空间参数;利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位;量化编码所述群延时和群相位以及所述空间参数。
    本发明实施例提供了一种估计立体声信号的方法,所述方法包括:
    确定关于频域立体声左右声道信号间的加权的互相关函数;对加权的所述互相关函数进行预处理;根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位。
    本发明实施例提供了一种估计立体声信号的装置,所述装置包括:
    加权互相关单元,用于确定关于频域立体声左右声道信号间的加权的互相关函数;预处理单元,用于对加权的所述互相关函数进行预处理;估计单元,根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位。
    本发明实施例提供了一种立体声信号编码的设备,所述设备包括:
    变换装置,用于变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号;下混装置,用于频域上的左声道信号和右声道信号经过下混生成单声道下混信号;参数提取装置,用于提取频域上左声道信号和右声道信号的空间参数;估计立体声信号装置,用于利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位;编码装置,用于量化编码所述群延时和群相位,所述空间参数和所述单声道下混信号。
    本发明实施例提供了一种立体声信号编码的系统,所述系统包括:
    如上所述立体声信号编码的设备、接收设备以及传送设备,接收设备用于接收立体声输入信号用于立体声编码设备;传送设备52,用于传送所述立体声编码设备51的结果。
    因此,通过引入本发明实施例,群延时和群相位被估计并被应用到立体声编码中来,使得通过全局的方位信息估计方法在低码率下能得到更为准确的声场信息,增强了声场效果,极大的提升编码效率。
    附图说明
    为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技 术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
    图1为一立体声编码方法实施示意图;
    图2为又一立体声编码方法实施示意图;
    图3为又一立体声编码方法实施示意图;
    图4a为又一立体声编码方法实施示意图;
    图4b为又一立体声编码方法实施例示意图;
    图5为又一立体声编码方法实施示意图;
    图6为一估计立体声信号装置实施示意图;
    图7为又一估计立体声信号装置实施示意图;
    图8为又一估计立体声信号装置实施示意图;
    图9为又一估计立体声信号装置实施示意图;
    图10为又一估计立体声信号装置实施示意图;
    图11为一立体声信号编码设备实施示意图;
    图12为一立体声信号编码系统实施示意图;
    具体实施方式
    下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例?;诒痉⒚髦械氖凳├?,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明?;さ姆段?。
    实施例一:
    图1为一立体声编码方法实施的示意图,包括:
    步骤101:变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号。
    步骤102:频域上的左声道频域信号和右声道频域信号经过下混生成单声道下混信号(DMX),传送DMX信号进行编码量化后的比特,以及将提取的频域上左声道信号和右声道信号的空间参数进行量化编码。
    空间参数为代表立体声信号空间特性的参数,如ILD参数。
    步骤103:利用频域上左右声道信号估计频域上的左声道信号和右声道信号间的群延时(Group Delay)以及群相位(Group Phase)。
    群延时反映出立体声左右声道之间的包络的时间延时的全局方位信息,群相位反映立体声左右声道在时间对齐后的波形的相似性的全局信息。
    步骤104:量化编码所述估计得到的群延时和群相位。
    群延时和群相位经过量化编码形成待传送边信息码流的内容。
    本发明实施例立体声编码的方法中,在提取立体声信号空间特性参数的同时估计群延时和群相位,估计得到群延时和群相位被应用到立体声编码中,使得空间参数和全局的方位信息有效的结合,通过全局的方位信息估计方法在低码率下能得到更为准确的声场信息,增强了声场效果,极大的提升编码效率。
    实施例二:
    图2为另一立体声编码方法实施例的示意图,包括:
    步骤201,变换时域立体声左声道信号和右声道信号到频域形成在频域上的立体声左声道信号X1(k)和右声道信号X2(k),其中k为频率信号的频率点的索引值。
    步骤202,对频域上的左声道信号和右声道信号进行下混操作,编码量化下混信号并传送,以及编码立体声空间参数,量化形成边信息并传送,可以包括如下步骤:
    步骤2021,频域上的左声道信号和右声道信号进行下混,生成合成后的单声道下混信号DMX。
    步骤2022,编码量化单声道下混信号DMX,并传送量化的信息。
    步骤2023,提取频域上的左声道信号和右声道信号的ILD参数。
    步骤2024,对所述ILD参数进行量化编码形成边信息并传送。
    2021、2022步骤和2023、2024步骤相互不影响,可独立执行,前者形成的边信息可与后者形成的边信息进行复用后传送。
    在另一实施方案中,经过下混得到的单声道下混信号可以再进行频时变换得到单声道下混信号DMX的时域信号,将单声道下混信号DMX的时域信号进行编码量化后的比特进行传送。
    步骤203,估计频域上的左右声道信号间的群延时以及群相位。
    利用频域上左右声道信号估计左右声道信号间的群延时以及群相位包括确定关于立体声左右声道频域信号的互相关函数,根据互相关函数的信号估计得到立体声信号的群延时以及群相位,如图3所示,具体可以包括如下步骤:
    步骤2031,确定关于频域上立体声左右声道信号间的互相关函数。
    立体声左右声道频域信号的互相关函数可以为加权的互相关函数,在确定互相关函数的过程中对估计群延时和群相位的互相关函数进行加权操作相比与其他操作而言使得立体声信号编码结果更加倾于稳定,加权的互相关函数即左声道频域信号与右声道频域信号的共轭的乘积的加权,所述加权的互相关函数在立体声信号时频变换的长度N一半的 频点上的值为0。立体声左右声道频域信号的互相关函数的形式可以如下表示:
    Cr(k)=W(k)X1(k)X*2(k)0kN/20k>N/2,]]>
    其中w(k)表示加权函数,X*2(k)表示X2(k)的共轭函数,或者也可以表示为:Cr(k)=X1(k)X*2(k)0≤k≤N/2+1。在另一互相关函数的形式中,结合不同的加权形式,立体声左右声道频域信号的互相关函数可以如下表示:
    Cr(k)=X1(k)X2*(k)/|X1(k)||X2(k)|k=02*X1(k)X2*(k)/|X1(k)||X2(k)|1kN/2-1X1(k)X2*(k)/|X1(k)||X2(k)|k=N/20k>N/2,]]>
    其中,N为立体声信号时频变换的长度,|X1(k)|和|X2(k)|为X1(k)和X2(k)对应的幅度。加权的互相关函数在频点0,频点N/2上为左右声道信号在对应频点上幅度乘积的倒数,加权的互相关函数在其他频点上为左右声道信号在幅度积的倒数的2倍。在其他的实施中,立体声左右声道频域信号的加权的互相关函数还可以表示为其他的形式,例如:
    Cr(k)=X1(k)X2*(k)/X1(k)2+X2(k)2k=02*X1(k)X2*(k)/X1(k)2+X2(k)21kN/2-1X1(k)X2*(k)/X1(k)2+X2(k)2k=N/20k>N/2,]]>
    对此,本实施例不进行限制,上述各公式的任意变形都在?;し段е?。
    步骤2032,对关于立体声左右声道频域信号的加权的互相关函数进行逆时频变换得到互相关函数时域信号Cr(n),此处互相关函数时域信号是复数的信号。
    步骤2033,根据互相关函数时域信号估计得到立体声信号的群延时以及群相位。
    在另一实施例中,可以直接根据步骤2031确定的关于频域上立体声左右声道信号间的互相关函数估计得到立体声信号的群延时以及群相位。
    在步骤2033中,可以直接根据互相关函数时域信号估计得到立体声信号的群延时以及群相位;也可以对互相关函数时域信号进行一些信号预处理,基于预处理后的信号估计立体声信号的群延时以及群相位。
    若对互相关函数时域信号进行一些信号预处理,基于预处理后的信号估计立体声信号的群延时以及群相位可以包括:
    1)对互相关函数时域信号进行归一化处理或平滑处理;
    其中对互相关函数时域信号进行平滑处理可以如下进行:
    Cravg(n)=α*Cravg(n)+β*Cr(n)
    其中,α和β是加权的常数,0≤α≤1,β=1-α,对本实施例中,在估计群延时以及群相位前对获得的左右声道间的互相关函数时域信号进行平滑等预处理使得估计出的群延时更好稳定。
    2)对互相关函数时域信号进行归一化处理之后进一步进行平滑处理;
    3)对互相关函数时域信号的绝对值进行归一化处理或平滑处理;
    其中对互相关函数时域信号的绝对值进行平滑处理可以如下进行:
    Cravg_abs(n)=α*Cravg(n)+β*|Cr(n)|,
    4)互相关函数时域信号进行归一化处理之后的绝对值信号进一步进行平滑处理。
    可以理解的,在估计立体声信号的群延时以及群相位前,对于互相 关函数时域信号的前处理还可以包括其他的处理,例如自相关处理等,此时对互相关函数时域信号的预处理还包括自相关或/和平滑处理等。
    结合上述的互相关函数时域信号的前处理,步骤2033中估计立体声信号的群延时以及群相位采用相同的估计方式,也可以分别进行估计,具体的,至少可以采用下述估计群相位和群延时的实施方式:
    步骤2033实施方式一,如图4a所示:
    根据互相关函数时域信号或基于处理后的互相关函数时域信号中幅度最大的值对应的索引估计得到群延时,获得群延时对应的互相关函数对应的相角,估计得到群相位,包括如下步骤:
    判断时域信号互相关函数中幅度最大的值对应的索引和与变换长度N相关的对称区间的关系,在一个实施例中,如果时域信号互相关函数中幅度最大的值对应的索引小于等于N/2,那么群延时等于该时域信号互相关函数中幅度最大的值对应的索引,如果相关函数中幅度最大的值对应的索引大于N/2,那么群延时为该索引减去变换长度N,可以将[0,N/2]和(N/2,N]看作与立体声信号时频变换长度N相关的第一对称区间和第二对称区间,在另一种实施中,判断的范围可以为[0,m]和(N-m,N]的第一对称区间和第二对称区间,其中m小于N/2,时域信号互相关函数中幅度最大的值对应的索引与m的相关信息进行比较,当时域信号互相关函数中幅度最大的值对应的索引位于区间[0,m],则群延时等于该时域信号互相关函数中幅度最大的值对应的索引,当时域信号互相关函数中幅度最大的值对应的索引位于区间(N-m,N],则群延时为该索引减去变换长度N。,但在实际应用中,进行判断的可以是时域信号互相关函数中幅度最大的值对应的索引的临近值,在不影响主观效果的条件下或者根据需求的限定可以适当选择稍小于幅度最大的值对应 的索引作为判断条件,如幅度第二大的值对应的索引或者和幅度最大值相差在固定或预设范围的值对应的索引都适用,以时域信号互相关函数中幅度最大的值对应的索引为例,一种具体的形式体现如下:
    dg=argmax|Cravg(n)|argmax|Cravg(n)|N/2argmax|Cravg(n)|-Nargmax|Cravg(n)|>N/2,]]>其中argmax|Cravg(n)|是Cravg(n)中幅度最大的值对应的索引,本实施例同样?;ど鲜鲂问降母髦直湫?。
    根据群延时对应的时域信号互相关函数对应的相角,当群延时dg大于等于零,通过确定dg对应的互相关值对应的相角估计得到群相位;当dg小于零时,群相位就是dg+N索引上对应的互相关值对应的相角,具体可以采用下面的一种形式或该形式的任意变形体现:
    θg=&angle;Cravg(dg)dg&GreaterEqual;0&angle;Cravg(dg+N)dg<0,]]>其中∠Cravg(dg)为时域信号互相关函数值Cravg(dg)的相角,∠Cravg(dg+N)为时域信号互相关函数值Cravg(dg+N)的相角。
    步骤2033实施方式二,如图4b所示:
    对所述互相关函数,或基于处理后的所述互相关函数,提取其相位其中函数∠Cr(k用于提取复数Cr(k)的相角,在低带一个频率内求取相位差的均值α1,根据相位差和变换长度的乘积与频率信息的比值关系确定群延时,同样的,根据所述互相关函数当前频点的相位与频点索引和相位差均值乘积的差值得到群相位信息,具体可以采用如下的方式:
    α1=E{Φ^(k+1)-Φ^(k)}k<Max;]]>
    dg=-a1N2*π*Fs;]]>
    θg=E{Φ^(k)-a1*k}k<Max10]]>
    其中表示相位差的均值,Fs为采用的频率,Max为计算群延时和群相位的截止上限,防止相位旋转。
    步骤204:量化编码所述群延时和群相位形成边信息进行传送。
    在预设或随机范围内对群延时进行标量量化,该范围为对称的正负值[-Max,Max]或者随机条件下的可用值,对标量量化后的群延时采用一个较长的时间传输或者采用差分编码处理得到边信息,群相位的取值范围通常在[0,2*PI]范围内,具体可以为[0,2*PI),也可以为(-PI,PI]的范围内对群相位进行标量量化和编码,将量化编码后的群延时和群相位形成的边信息进行复用形成编码码流,传送到立体声信号恢复装置。
    本发明实施例立体声编码的方法中,利用频域上的左右声道信号估计立体声信号左右声道间的能体现信号全局方位信息的群延时和群相位使得声场的方位信息得到有效的增强,将立体声信号空间特性参数和群延时以及群相位的估计相结合应用于码率需求不大的立体声编码中,使得空间信息和全局的方位信息有效的结合,得到更为准确的声场信息,增强了声场效果,极大的提升编码效率。
    实施例三
    图5为另一立体声编码方法实施的示意图,包括:
    分别在实施例一和实施例二的实施基础上,立体声编码还包括:
    步骤105/205:根据所述群相位和群延时信息估计得到立体声参数IPD,量化所述IPD参数并传送。
    量化IPD时,用群延时(Group Delay)和群相位(Group Phase) 来估计并与原始的IPD(k)进行差分处理,对差分的IPD进行量化编码,可如下表示:
    IPD(k)&OverBar;=-2πdg*kN+θg,]]>1≤k≤N/2-1
    并对IPDdiff(k)进行量化,量化后的比特送到解码端,在另一实施例中,也可直接量化IPD,比特流稍高,量化更精确。
    本实施例中,估计立体声参数IPD并编码量化在有较高码率可用的情况下可以提升编码效率,增强声场效果。
    实施例四,
    图6为一估计立体声信号的装置04实施示意图,包括:
    加权互相关单元41,用于确定关于频域立体声左右声道信号间的加权的互相关函数。
    加权互相关单元41接收频域上立体声左右声道信号,对频域立体声左右声道信号进行处理得到关于频域立体声左右声道信号间的加权的互相关函数。
    预处理单元42,用于对加权的所述互相关函数进行预处理。
    预处理单元42接收根据加权互相关单元41得到的加权的所述互相关函数,对加权的所述互相关函数进行预处理,得到预处理结果,即预处理后的互相关函数时域信号。
    估计单元43,根据预处理结果估计立体声左右声道信号间的群延时以及群相位。
    估计单元43接收预处理单元42的预处理结果,获取预处理后的互相关函数时域信号,提取所述互相关函数时域信号的信息加以判断或比 较或计算操作估计得到立体声左右声道信号间的群延时以及群相位。
    本另一实施例中,估计立体声信号的装置04还可以包括频时变换单元44,用于接收加权互相关单元41的输出,对关于频域立体声左右声道信号的加权的所述互相关函数进行逆时频变换得到互相关函数时域信号,并将所述互相关函数时域信号传送给所述预处理单元42。
    通过引入本发明实施例,群延时和群相位被估计并被应用到立体声编码中来,使得通过全局的方位信息估计方法在低码率下能得到更为准确的声场信息,增强了声场效果,极大的提升编码效率。
    实施例五,
    图7为另一估计立体声信号的装置04实施示意图,包括:
    加权互相关单元41,接收频域上立体声左右声道信号,对频域立体声左右声道信号进行处理得到关于频域立体声左右声道信号间的加权的互相关函数。立体声左右声道频域信号的互相关函数可以为加权的互相关函数,使得编码结果更加稳定,加权的互相关函数即左声道频域信号与右声道频域信号的共轭的乘积的加权,所述加权的互相关函数在立体声信号时频变换的长度N一半的频点上的值为0。立体声左右声道频域信号的加权的互相关函数的形式可以如下表示:
    Cr(k)=W(k)X1(k)X*2(k)0kN/20k>N/2,]]>
    其中w(k)表示加权函数,X*2(k)表示X2(k)的共轭函数,或者也可以表示为:Cr(k)=X1(k)X*2(k)0≤k≤N/2+1。在另一加权的互相关函数的形式中,结合不同的加权形式,立体声左右声道频域信号的加权的互相关函数可以如下表示:
    Cr(k)=X1(k)X2*(k)/|X1(k)||X2(k)|k=02*X1(k)X2*(k)/|X1(k)||X2(k)|1kN/2-1X1(k)X2*(k)/|X1(k)||X2(k)|k=N/20k>N/2,]]>
    其中,N为立体声信号时频变换的长度,|X1(k)|和|X2(k)|为X1(k)和X2(k)对应的幅度。加权的互相关函数在频点0,频点N/2上为左右声道信号在对应频点上幅度乘积的倒数,加权的互相关函数在其他频点上为左右声道信号在幅度积的倒数的2倍。
    或者也可以采用如下的形式以及其变形:
    Cr(k)=X1(k)X2*(k)/X1(k)2+X2(k)2k=02*X1(k)X2*(k)/X1(k)2+X2(k)21kN/2-1X1(k)X2*(k)/X1(k)2+X2(k)2k=N/20k>N/2.]]>
    频时变换单元44,接收加权互相关单元41确定的确定关于频域立体声左右声道信号间的加权的互相关函数,对关于立体声左右声道频域信号的加权的互相关函数进行逆时频变换得到互相关函数时域信号Cr(n),此处互相关函数时域信号是复数的信号。
    预处理单元42,接收频时变换根据所述互相关函数得到的所述互相关函数时域信号,对所述互相关函数进行预处理,得到预处理结果,即经过预处理后的互相关函数时域信号。
    预处理单元42根据不同的需求可以包括下述单元中的一种或多种:归一化单元421、预处理单元422和绝对值单元423。
    1)归一化单元421对互相关函数时域信号进行归一化处理或预处理单元422对互相关函数时域信号进行预处理处理。
    其中对互相关函数时域信号进行预处理处理可以如下进行:Cravg(n)=α*Cravg(n)+β*Cr(n)
    其中,α和β是加权的常数,0≤α≤1,β=1-α,对本实施例中,在估计群延时以及群相位前对获得的左右声道间的加权的互相关函数进行预处理等预处理使得估计出的群延时更好稳定。
    2)归一化单元421对互相关函数时域信号进行归一化处理之后,预处理单元422进一步对归一化单元421的结果进行预处理处理。
    3)绝对值单元423获得互相关函数时域信号的绝对值信息,归一化单元421对所述绝对值信息进行归一化处理或预处理单元422对所述绝对值信息进行预处理处理,或者先进行归一化再进行预处理处理。
    其中对互相关函数时域信号的绝对值进行预处理处理可以如下进行,
    Cravg_abs(n)=α*Cravg(n)+β*|Cr(n)|。
    4)互相关函数时域信号进行归一化处理之后的绝对值信号进一步进行预处理处理。
    预处理单元42在估计立体声信号的群延时以及群相位前,对于互相关函数时域信号的前处理还可以包括其他的处理单元,例如自相关单元424等,此时预处理单元42对互相关函数时域信号的预处理还包括自相关或/和预处理处理等。
    在另一实施例中,所述估计立体声信号装置04也可以不包括预处理单元,频时变换单元44的结果被直接送入所述估计立体声信号装置4的如下估计单元43中,估计单元43用于根据加权的互相关函数时域信号或基于处理后的加权的互相关函数时域信号中幅度最大的值对应的索引估计得到群延时,获得群延时对应的时域信号互相关函数对应的相角,估计得到群相位。
    估计单元43,根据预处理单元42的输出或者频时变换单元44的输 出估计立体声左右声道信号间的群延时以及群相位,如图8所示,估计单元43进一步包括:431判断单元,接收预处理单元42或频时变换单元44输出的互相关函数时频信号,判断时域信号互相关函数中幅度最大的值对应的索引和与变换长度N相关的对称区间的关系,判断结果被传送到群延时单元432,激发群延时单元432估计立体声信号左右声道间的群延时,在一个实施例中,如果判断单元431的结果为时域信号互相关函数中幅度最大的值对应的索引小于等于N/2,群延时单元432估计群延时等于该时域信号互相关函数中幅度最大的值对应的索引,如果判断单元431的结果为相关函数中幅度最大的值对应的索引大于N/2,群延时单元432估计群延时为该索引减去变换长度N,可以将[0,N/2]和(N/2,N]看作与立体声信号时频变换长度N相关的第一对称区间和第二对称区间,在另一种实施中,判断的范围可以为[0,m]和(N-m,N]的第一对称区间和第二对称区间,其中m小于N/2,时域信号互相关函数中幅度最大的值对应的索引与m的相关信息进行比较,当时域信号互相关函数中幅度最大的值对应的索引位于区间[0,m],则群延时等于该时域信号互相关函数中幅度最大的值对应的索引,当时域信号互相关函数中幅度最大的值对应的索引位于区间(N-m,N],则群延时为该索引减去变换长度N。,但在实际应用中,进行判断的可以是时域信号互相关函数中幅度最大的值对应的索引的临近值,在不影响主观效果的条件下或者根据需求的限定可以适当选择稍小于幅度最大的值对应的索引作为判断条件,如幅度第二大的值对应的索引或者和幅度最大值相差在固定或预设范围的值对应的索引都适用,包括如下的一种形式或该形式的任意变形:
    dg=argmax|Cravg(n)|argmax|Cravg(n)|N/2argmax|Cravg(n)|-Nargmax|Cravg(n)|>N/2,]]>其中argmax|Cravg(n)|是Cravg(n)中幅度最大的值对应的索引。群相位单元433,接收群延时单元432结果,根据估计得到的群延时时域信号互相关函数对应的相角,当群延时dg大于等于零,通过确定dg对应的互相关值对应的相角估计得到群相位;当dg小于零时,群相位就是dg+N索引上对应的互相关值对应的相角,具体可以采用下面的一种形式或该形式的任意变形体现:
    θg=&angle;Cravg(dg)dg&GreaterEqual;0&angle;Cravg(dg+N)dg<0,]]>其中∠Cravg(dg)为时域信号互相关函数值Cravg(dg)的相角,∠Cravg(dg+N)为时域信号互相关函数值Cravg(dg+N)的相角。
    另一实施例中,所述估计立体声信号的装置04还包括参数特性单元45,如图9所示,参数特性单元根据所述群相位和群延时信息估计得到立体声参数IPD。
    通过引入本发明实施例,群延时和群相位被估计并被应用到立体声编码中来,使得通过全局的方位信息估计方法在低码率下能得到更为准确的声场信息,增强了声场效果,极大的提升编码效率。
    实施例六,
    图10为另一估计立体声信号的装置04’实施示意图,与实施例五不同在于,本实施例中加权互相关单元确定的立体声左右声道频域信号的加权的互相关函数传送给预处理单元42或估计单元43,估计单元43提取互相关函数的相位,根据相位差和变换长度的乘积与频率信息的比值关系确定群延时,根据互相关函数当前频点的相位与频点索引和相位差均值乘积的差值得到群相位信息。
    估计单元43根据预处理单元42的输出或者加权互相关单元41的输出估计立体声左右声道信号间的群延时以及群相位,估计单元43进一步包括:相位提取单元430对互相关函数,或基于处理后的互相关函数,提取其相位其中函数∠Cr(k用于提取复数Cr(k)的相角,群延时单元432’在低带一个频率内求取相位差的均值α1,群相位单位433’根据相位差和变换长度的乘积与频率信息的比值关系确定群延时,同样的,根据互相关函数当前频点的相位与频点索引和相位差均值乘积的差值得到群相位信息,具体可以采用如下的方式:
    α1=E{Φ^(k+1)-Φ^(k)}k<Max]]>
    dg=-a1N2*π*Fs]]>
    θg=E{Φ^(k)-a1*k}k<Max]]>
    其中表示相位差的均值,Fs为采用的频率,Max为计算群延时和群相位的截止上限,防止相位旋转。
    本发明实施例立体声编码的设备中,利用频域上的左右声道信号估计立体声信号左右声道间的能体现信号全局方位信息的群延时和群相位使得声场的方位信息得到有效的增强,将立体声信号空间特性参数和群延时以及群相位的估计相结合应用于码率需求不大的立体声编码中,使得空间信息和全局的方位信息有效的结合,得到更为准确的声场信息,增强了声场效果,极大的提升编码效率。
    实施例七,
    图11为一立体声信号编码的设备51实施示意图,包括:
    变换装置01,用于变换时域立体声左声道信号和右声道信号到频域 形成频域上的左声道信号和右声道信号;
    下混装置02,用于频域上的左声道信号和右声道信号经过下混生成单声道下混信号;
    参数提取装置03,用于提取频域上左声道信号和右声道信号的空间参数;
    估计立体声信号装置04,用于利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位;
    编码装置05,用于量化编码所述群延时和群相位,所述空间参数和所述单声道下混信号。
    其中估计立体声装置04适用于上述实施例四-实施例六,估计立体声信号装置04接收经过变换装置01后得到的频域上的左声道信号和右声道信号,利用所述频域上的左右声道信号采取实施例四-实施例六中任一的实施方式估计得到立体声左右声道间的群延时以及群相位,并将得到的群延时以及群相位传送到编码装置05,同样,编码装置05还收到来至参数提取装置03提取到的频域上左声道信号和右声道信号的空间参数,编码装置05对接收到的信息进行量化编码形成边信息,编码装置05还量化所述下混信号进行编码量化后的比特。所述编码装置05可以为一个整体,用于接收不同的信息进行量化编码,也可以分离为多个编码装置处理接收到的不同的信息,如第一编码装置501和下混装置02连接,用于量化编码下混信息,第二编码装置502和参数提取装置连接,用于量化编码所述空间参数,第三编码装置503,用于和估计立体声信号装置连接,用于量化编码所述群延时以及群相位。在另一实施例中,若估计立体声信号装置04包括参数特性单元45,所述编码装置还可以包括第四编码装置用于量化编码IPD。量化IPD时,用群延时 (Group Delay)和群相位(Group Phase)来估计并与原始的IPD(k)进行差分处理,对差分的IPD进行量化编码,可以如下表示:
    IPD(k)&OverBar;=-2πdg*kN+θg,]]>1≤k≤N/2-1
    并对IPDdiff(k)进行量化得到量化后的比特,在另一实施例中,也可直接量化IPD,比特流稍高,量化更精确。
    所述立体声编码的设备51根据不同需求可以为立体声编码器或者其他对立体声多声道信号进行编码处理的设备。
    实施例八
    图12为一立体声信号编码的系统666实施示意图,在如实施例七所述立体声信号编码设备51的基础上还包括:
    接收设备50,接收立体声输入信号用于立体声信号编码设备51;传送设备52,用于传送所述立体声编码设备51的结果,一般情况下传送设备52将立体声编码设备的结果发送到解码端用于解码。
    本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
    最后应说明的是:以上实施例仅用以说明本发明实施例的技术方案而非对其进行限制,尽管参照较佳实施例对本发明实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明实施例的 技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明实施例技术方案的精神和范围。

    关 键 词:
    立体声 编码 方法 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:立体声编码的方法、装置.pdf
    链接地址://www.4mum.com.cn/p-5779120.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03