• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 26
    • 下载费用:30 金币  

    重庆时时彩平买: 移动终端及其语音输入方法和装置.pdf

    关 键 词:
    移动 终端 及其 语音 输入 方法 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201611139657.1

    申请日:

    2016.12.12

    公开号:

    CN106782589A

    公开日:

    2017.05.31

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G10L 21/0208申请日:20161212|||公开
    IPC分类号: G10L21/0208(2013.01)I; G10L21/0216(2013.01)I; G10L15/20; G10L15/22; H04M1/725; G07C5/08 主分类号: G10L21/0208
    申请人: 奇酷互联网络科技(深圳)有限公司
    发明人: 邱辉
    地址: 518000 广东省深圳市南山区学苑大道1001号南山智园A2栋1-10楼
    优先权:
    专利代理机构: 深圳市明日今典知识产权代理事务所(普通合伙) 44343 代理人: 王杰辉
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201611139657.1

    授权公告号:

    |||

    法律状态公告日:

    2017.06.23|||2017.05.31

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明揭示了一种移动终端及其语音输入方法和装置,其中方法应用于移动终端,第一麦克风接入移动终端的第一音频输入接口,包括移动终端判断其语音输入环境所处的状态;如果语音输入环境处于音频输出状态,则将参考信号接入移动终端预设的第二音频输入接口;如果语音输入环境处于拾音状态,则将第二麦克风接入移动终端预设的第二音频输入接口。本发明的移动终端及其语音输入方法和装置,可以实现在移动终端不同状态下采用单麦克风和双麦克风拾音,保证了移动终端必备的打断功能,同时还实现了外部环境噪声复杂时通过双麦克风拾音,提高语音输入的准确性。而且本发明只需要基于两路音频输入接口完成,无需添加语音处理IC,降低移动终端的成本。

    权利要求书

    1.一种语音输入方法,其应用于移动终端,其中,第一麦克风接入所述移动终端的第一
    音频输入接口,其特征在于,所述语音输入方法包括:
    所述移动终端判断其语音输入环境所处的状态;
    如果判定语音输入环境处于音频输出状态,则将参考信号接入所述移动终端预设的第
    二音频输入接口;
    如果判定语音输入环境处于拾音状态,则将第二麦克风接入所述移动终端预设的第二
    音频输入接口。
    2.根据权利要求1所述的语音输入方法,其特征在于,所述移动终端判断其语音输入环
    境所处的状态的步骤,包括:
    判断移动终端是否输出原生音频信号至音频功放;
    如果是,则判定语音输入环境处于所述音频输出状态;否则,判定语音输入环境处于所
    述拾音状态。
    3.根据权利要求2所述的语音输入方法,其特征在于,所述如果判定语音输入环境处于
    音频输出状态,则将参考信号接入所述移动终端预设的第二音频输入接口的步骤之后,包
    括:
    通过第一麦克风接收所述音频功放播放的对应所述原生音频信号的原生声音信号;
    根据所述参考信号对所述原生声音信号进行回音消除处理。
    4.根据权利要求3所述的语音输入方法,其特征在于,所述如果判定语音输入环境处于
    音频输出状态,则将参考信号接入所述移动终端预设的第二音频输入接口的步骤之后,包
    括:
    调用预设的单麦克风的降噪算法进行降噪处理。
    5.根据权利要求3所述的语音输入方法,其特征在于,所述根据所述参考信号对所述原
    生声音信号进行回音消除处理的步骤之后,包括:
    通过第一麦克风获取预设的语音命令,根据所述语音命令执行对应的任务。
    6.根据权利要求5所述的语音输入方法,其特征在于,所述通过第一麦克风获取预设的
    语音命令,根据所述语音命令执行对应的任务的步骤之后,包括:
    所述任务完成指定时间长度后,控制所述移动终端输出原生音频信号至音频功放。
    7.根据权利要求2所述的语音输入方法,其特征在于,所述如果判定语音输入环境处于
    拾音状态,则将第二麦克风接入所述移动终端预设的第二音频输入接口的步骤之后,包括:
    通过所述第一麦克风和第二麦克风接收外部声源的声音信号,并调用预设的双麦克风
    的降噪算法进行降噪处理。
    8.根据权利要求7所述的语音输入方法,其特征在于,所述如果判定语音输入环境处于
    拾音状态,则将第二麦克风接入所述移动终端预设的第二音频输入接口的步骤之后,包括:
    通过第一麦克风和第二麦克风接收语音信息,并判断语音信息中是否含有第一关键字
    语音;
    如果含有所述第一关键字语音,则记录所述第一麦克风和第二麦克风接收到第一关键
    字语音时的定位信息;
    根据各所述麦克风的位置坐标,以及所述定位信息,计算发出所述第一关键字语音的
    声源位置。
    9.一种语音输入装置,其应用于移动终端,其中,第一麦克风接入所述移动终端的第一
    音频输入接口,其特征在于,所述语音输入装置包括:
    判断单元,用于移动终端判断其语音输入环境所处的状态;
    第一接入单元,用于如果判定语音输入环境处于音频输出状态,则将参考信号接入所
    述移动终端预设的第二音频输入接口;
    第二接入单元,用于如果判定语音输入环境处于拾音状态,则将第二麦克风接入所述
    移动终端预设的第二音频输入接口。
    10.一种移动终端,其特征在于,包括处理器、第一麦克风、第二麦克风、模拟开关、音频
    功放、参考信号线路、以及设置第一音频输入接口和第二音频输入接口的音频数模转换器;
    所述处理器分别与所述模拟开关、音频数模转换器通信连接;所述音频数模转换器通
    信连接所述音频功放;所述第一麦克风接入所述第一音频输入接口;所述第二麦克风和参
    考信号线路连接所述模拟开关;所述模拟开关接入所述第二音频输入接口;
    所述处理器接收音频数模转换器的工作信号,判断所述移动终端的语音输入环境所处
    的状态;
    如果判定语音输入环境处于音频输出状态,则通过所述模拟开关将所述参考信号接入
    所述第二音频输入接口;
    如果判定语音输入环境处于拾音状态,则通过所述模拟开关将第二麦克风接入所述移
    动终端预设的第二音频输入接口。

    说明书

    移动终端及其语音输入方法和装置

    技术领域

    本发明涉及到语音处理领域,特别是涉及到移动终端及其语音输入方法和装置。

    背景技术

    具有语音识别等功能的移动终端,一般都具有音频打断功能,比如后视镜行车记
    录仪,需要具备打断功能,即支持渐进理解自由打断的功能,可随时根据语音指令对系统播
    报进行纠正和更改等;该功能需要使用到常用的回声+唤醒技术。其主要处理的流程为:在
    一个空间内同时存在移动终端播放的音频信号和声源信号,系统通过麦克风录音时能够采
    集到此两种信号,同时对移动终端播放的音频信号进行采样从而获得单独的参考信号,将
    此参考信号和麦克风采集到的两种信号混合后的声音信号做回声消除处理,只保留声源信
    号,最后将保留的声源信号送到唤醒引擎做唤醒处理,唤醒成功之后移动终端的系统会反
    馈给到主机,完成整个回声消除+唤醒过程。上述移动终端播放的音频信号即为后视镜行车
    记录仪等移动终端本身发出的音频信号,或者移动终端通过蓝牙、WIFI等通讯??榻邮盏?br />音频信号,该音频信号可以称之为原生音频信号,也就是非外部声源产生的信号,移动终端
    播放音频信号的状态可认为移动终端处于音频输出状态;如果移动终端未播放音频信号,
    则认为移动终端处于拾音状态,此状态下,移动终端无需进行回声消除处理。

    现有MT6753等只支持两路麦克风输入的声音处理平台,使用较为广泛,其中,上述
    声音处理平台的第一音频输入接口连接一枚麦克风拾取声音,另外的第二音频输入接口接
    收参考信号进行回声消除参考用;因此述声音处理平台在不增加单独的语音处理IC的情况
    下,麦克风拾取声音只能实现单麦克风降噪,在环境噪声复杂的情况下会大大降低环境降
    噪的能力;而通过增加单独的语音处理IC(integratedcircuit,缩写:IC;其为半导体元件
    产品的统称,包括:1.集成电路;2.二、三极管;3.特殊电子元件)来实现多麦克风降噪能力,
    其成本会太高,性价比很低。

    发明内容

    本发明的主要目的为提供一种无需增加语音处理IC即可实现多麦克风降噪的移
    动终端及其语音输入方法和装置。

    为了上述发明目的,本发明提出一种语音输入方法,其应用于移动终端,其中,第
    一麦克风接入所述移动终端的第一音频输入接口,所述语音输入方法包括:

    移动终端判断其语音输入环境所处的状态;

    如果判定语音输入环境处于音频输出状态,则将参考信号接入所述移动终端预设
    的第二音频输入接口;

    如果判定语音输入环境处于拾音状态,则将第二麦克风接入所述移动终端预设的
    第二音频输入接口。

    进一步地,所述移动终端判断其语音输入环境所处的状态的步骤,包括:

    判断移动终端是否输出原生音频信号至音频功放;

    如果是,则判定语音输入环境处于所述音频输出状态;否则,判定语音输入环境处
    于所述拾音状态。

    进一步地,所述如果判定语音输入环境处于音频输出状态,则将参考信号接入所
    述移动终端预设的第二音频输入接口的步骤之后,包括:

    通过第一麦克风接收所述音频功放播放的对应所述原生音频信号的原生声音信
    号;

    根据所述参考信号对所述原生声音信号进行回音消除处理。

    进一步地,所述如果判定语音输入环境处于音频输出状态,则将参考信号接入所
    述移动终端预设的第二音频输入接口的步骤之后,包括:

    调用预设的单麦克风的降噪算法进行降噪处理。

    进一步地,所述根据所述参考信号对所述原生声音信号进行回音消除处理的步骤
    之后,包括:

    通过第一麦克风获取预设的语音命令,根据所述语音命令执行对应的任务。

    进一步地,所述通过第一麦克风获取预设的语音命令,根据所述语音命令执行对
    应的任务的步骤之后,包括:

    所述任务完成指定时间长度后,控制所述移动终端输出原生音频信号至音频功
    放。

    进一步地,所述如果判定语音输入环境处于拾音状态,则将第二麦克风接入所述
    移动终端预设的第二音频输入接口的步骤之后,包括:

    通过所述第一麦克风和第二麦克风接收外部声源的声音信号,并调用预设的双麦
    克风的降噪算法进行降噪处理。

    进一步地,所述如果判定语音输入环境处于拾音状态,则将第二麦克风接入所述
    移动终端预设的第二音频输入接口的步骤之后,包括:

    通过第一麦克风和第二麦克风接收语音信息,并判断语音信息中是否含有第一关
    键字语音;

    如果含有所述第一关键字语音,则记录所述第一麦克风和第二麦克风接收到第一
    关键字语音时的定位信息;

    根据各所述麦克风的位置坐标,以及所述定位信息,计算发出所述第一关键字语
    音的声源位置。

    进一步地,所述根据各所述麦克风的位置坐标,以及所述定位信息,计算发出所述
    第一关键字语音的声源位置的步骤之后,包括:

    根据所述声源位置,利用预设的拾音算法拾取所述声源方向的语音信息。

    进一步地,所述移动终端判断其语音输入环境所处的状态的步骤之前,包括:

    如果接收到来电信号,则直接进入所述拾音状态。

    本发明还提供一种语音输入装置,其应用于移动终端,其中,第一麦克风接入所述
    移动终端的第一音频输入接口,所述语音输入装置包括:

    判断单元,用于移动终端判断其语音输入环境所处的状态;

    第一接入单元,用于如果判定语音输入环境处于音频输出状态,则将参考信号接
    入所述移动终端预设的第二音频输入接口;

    第二接入单元,用于如果判定语音输入环境处于拾音状态,则将第二麦克风接入
    所述移动终端预设的第二音频输入接口。

    进一步地,所述判断单元,包括:

    判断???,用于判断移动终端是否输出原生音频信号至音频功放;

    判定???,用于如果移动终端输出原生音频信号至音频功放,则判定语音输入环
    境处于所述音频输出状态;否则,判定语音输入环境处于所述拾音状态。

    进一步地,所述语音输入装置,还包括:

    接收单元,用于通过第一麦克风接收所述音频功放播放的对应所述原生音频信号
    的原生声音信号;

    消音单元,用于根据所述参考信号对所述原生声音信号进行回音消除处理。

    进一步地,所述语音输入装置,还包括:

    第一调用单元,用于调用预设的单麦克风的降噪算法进行降噪处理。

    进一步地,所述语音输入装置,还包括:

    获取执行单元,用于通过第一麦克风获取预设的语音命令,根据所述语音命令执
    行对应的任务。

    进一步地,所述语音输入装置,还包括:

    控制输出单元,用于所述任务完成指定时间长度后,控制所述移动终端输出原生
    音频信号至音频功放。

    进一步地,所述语音输入装置,还包括:

    第二调用单元,用于通过所述第一麦克风和第二麦克风接收外部声源的声音信
    号,并调用预设的双麦克风的降噪算法进行降噪处理。

    进一步地,所述语音输入装置,还包括:

    关键音判断单元,用于通过第一麦克风和第二麦克风接收语音信息,并判断语音
    信息中是否含有第一关键字语音;

    记录单元,用于如果含有所述第一关键字语音,则记录所述第一麦克风和第二麦
    克风接收到第一关键字语音时的定位信息;

    计算定位单元,用于根据各所述麦克风的位置坐标,以及所述定位信息,计算发出
    所述第一关键字语音的声源位置。

    进一步地,所述语音输入装置,还包括:

    定向拾音单元,用于根据所述声源位置,利用预设的拾音算法拾取所述声源方向
    的语音信息。

    进一步地,所述语音输入装置,还包括:

    接收进入单元,用于如果接收到来电信号,则直接进入所述拾音状态。

    本发明还提供一种移动终端,包括处理器、第一麦克风、第二麦克风、模拟开关、音
    频功放、参考信号线路、以及设置第一音频输入接口和第二音频输入接口的音频数模转换
    器;

    所述处理器分别与所述模拟开关、音频数模转换器通信连接;所述音频数模转换
    器通信连接所述音频功放;所述第一麦克风接入所述第一音频输入接口;所述第二麦克风
    和参考信号线路连接所述模拟开关;所述模拟开关接入所述第二音频输入接口;

    所述处理器接收音频数模转换器的工作信号,判断所述移动终端的语音输入环境
    所处的状态;

    如果判定语音输入环境处于音频输出状态,则通过所述模拟开关将所述参考信号
    接入所述第二音频输入接口;

    如果判定语音输入环境处于拾音状态,则通过所述模拟开关将第二麦克风接入所
    述移动终端预设的第二音频输入接口。

    进一步地,所述处理器判断所述移动终端的语音输入环境所处的状态的方法,包
    括:

    判断移动终端是否输出原生音频信号至音频功放;如果是,则判定语音输入环境
    处于所述音频输出状态;否则,判定语音输入环境处于所述拾音状态。

    进一步地,所述处理器判定语音输入环境处于音频输出状态后,通过所述第一麦
    克风接收所述音频功放播放的对应所述原生音频信号的原生声音信号;根据所述参考信号
    对所述原生声音信号进行回音消除处理。

    进一步地,所述处理器判定语音输入环境处于音频输出状态后,调用预设的单麦
    克风的降噪算法进行降噪处理。

    进一步地,所述处理器通过所述第一麦克风获取预设的语音命令,根据所述语音
    命令执行对应的任务。

    进一步地,所述处理器在所述任务完成指定时间长度后,控制所述音频数模转换
    器输出原生音频信号至音频功放。

    进一步地,所述处理器判定语音输入环境处于拾音状态后,通过所述第一麦克风
    和第二麦克风接收外部声源的声音信号,并调用预设的双麦克风的降噪算法进行降噪处
    理。

    进一步地,所述处理器判定语音输入环境处于拾音状态后,通过第一麦克风和第
    二麦克风接收语音信息,并判断语音信息中是否含有第一关键字语音;如果含有所述第一
    关键字语音,则记录所述第一麦克风和第二麦克风接收到第一关键字语音时的定位信息;
    根据各所述麦克风的位置坐标,以及所述定位信息,计算发出所述第一关键字语音的声源
    位置。

    进一步地,所述处理器根据所述声源位置,利用预设的拾音算法拾取所述声源方
    向的语音信息。

    进一步地,所述处理器在判断所述移动终端的语音输入环境所处的状态之前,如
    果移动终端接收到来电信号,则控制移动终端直接进入所述拾音状态。

    本发明的移动终端及其语音输入方法和装置,可以实现在移动终端不同状态下采
    用单麦克风和双麦克风拾音,保证了移动终端必备的打断功能,同时还实现了外部环境噪
    声复杂时通过双麦克风拾音,提高语音输入的准确性。而且本发明只需要基于两路音频输
    入接口完成,无需添加语音处理IC,降低移动终端的成本。

    附图说明

    图1为本发明一实施例的语音输入方法的流程示意图;

    图2为本发明一具体实施例的语音输入方法的流程示意图;

    图3为本发明一实施例的语音输入装置的结构示意框图;

    图4为本发明一实施例的判断单元的结构示意框图;

    图5为本发明一具体实施例的语音输入装置的结构示意框图;

    图6为本发明一实施例的移动终端的结构示意框图。

    本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

    具体实施方式

    应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

    本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一
    个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措
    辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加
    一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/
    或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

    本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术
    语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义?;褂Ω?br />理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的
    意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义
    来解释。

    本技术领域技术人员可以理解,这里的移动终端是指智能手机、电脑、平板电脑、
    形成记录仪等可以运行计算机程序的电子设备。

    参照图1,本发明实施例提供一种语音输入方法,其应用于移动终端,其中,第一麦
    克风接入所述移动终端的第一音频输入接口,所述语音输入方法包括步骤:

    S1、移动终端判断其语音输入环境所处的状态;

    S2、如果判定语音输入环境处于音频输出状态,则将参考信号接入所述移动终端
    预设的第二音频输入接口;

    S3、如果判定语音输入环境处于拾音状态,则将第二麦克风接入所述移动终端预
    设的第二音频输入接口。

    如上述步骤S1、S2、S3所述,上述移动终端的语音输入环境一般包括两种,即音频
    输出状态和拾音状态。上述音频输出状态,是指移动终端本身输出音频的状态,如移动终端
    播放其自身播放的音乐音频,或者接收电台的广播音频、或者通过蓝牙/WIFI等通信??榻?br />收的音频等。上述拾音状态,是指移动终端没有输出音频信号,即移动终端本身并没有输出
    音频。本实施例中,上述移动终端的语音输入环境处于音频输出状态时,同样可以拾音,但
    是在拾音的过程中还会输出音乐等音频信号。上述参考信号即为移动终端采集其本身输出
    音频的采样信号。上述第二麦克风即为拾音装置。上述步骤S2和S3是并列的两个步骤,移动
    终端会根据语音输入环境所处的状态进行择一进行,也就是步骤S2和S3不会同时进行。本
    实施例中,上述参考信号和第二麦克风共用同一个第二音频输入接口,根据语音输入环境
    所处的状态进行转换,在移动终端的音频数模转换器只要设置两个音频输入接口的情况
    下,既可以准确地实现音频打断功能,还可以实现双麦克风拾音,提高拾音效果。更为重要
    的时,无需在移动终端的音频数模转换器添加单独的语音处理IC,大大地减低生产成本。

    本实施例中,上述移动终端判断其语音输入环境所处的状态的步骤S1,包括:

    S11、判断移动终端是否输出原生音频信号至音频功放;

    S12、如果是,则判定语音输入环境处于所述音频输出状态;否则,判定语音输入环
    境处于所述拾音状态。

    如上述步骤S11和S12所述,移动终端可以清楚地知道其是否发出原生音频信号至
    音频功放,如果发送,则判定语音输入环境处于所述音频输出状态,如果未发送,判定语音
    输入环境处于所述拾音状态,方法简单、高效,准确率高。上述原生音频信号即为移动终端
    本身发出的音频信号,或者移动终端通过蓝牙、WIFI等通讯??榻邮盏囊羝敌藕?。即,原生
    音频信号不是通过麦克风拾取移动终端外部声源发出的音频信号。

    参照图2,本实施例中,上述如果判定语音输入环境处于音频输出状态,则将参考
    信号接入所述移动终端预设的第二音频输入接口的步骤S2之后,包括:

    S21、通过第一麦克风接收所述音频功放播放的对应所述原生音频信号的原生声
    音信号;

    S22、根据所述参考信号对所述原生声音信号进行回音消除处理。

    如上述步骤S21和S22所述,上述第一麦克风同样是拾音装置,其单独连接在移动
    终端的音频数模转换器上的第一音频输入接口。上述音频功放全名为音频功率放大器,是
    用于推动扬声器发声,从而重现声音的功放装置,其连接扬声器。上述原生声音信号即为原
    生音频信号通过音频功放处理后由扬声器发出的声音信号。因为原生音频信号在经过音频
    功放之前会被采样得到上述参考信号,然后参考信号与第一麦克风接收到声音信号进行比
    对,将与参考信号匹配的声音信号进行消除处理,而与参考信号匹配的信号一般即为上述
    原生声音信号,所以,当第一麦克风采集到原生声音信号和外部声源的声音信号后,可以将
    原生声音信号过滤掉,只保留外部声源的声音信号,如果外部声源的声音信号为语音命令
    时,会更容易被移动终端准确识别。

    参照图2,本实施例中,上述如果判定语音输入环境处于音频输出状态,则将参考
    信号接入所述移动终端预设的第二音频输入接口的步骤S2之后,包括:

    S23、调用预设的单麦克风的降噪算法进行降噪处理。

    如上述步骤S23所述,上述单麦克风的降噪算法包括多种,比如,预设噪音的频谱,
    在外部声源和环境音被麦克风一起拾取后,将与预设噪音的频谱相同的声音信号进行过
    滤;或者,麦克风先获取环境音并记录,当外部声源和环境音被麦克风一起拾取后,将与先
    获取记录的环境音相同或近似的声音信号消除,保留外部声源的声音信号等。

    参照图2,本实施例中,所述根据参考信号对所述原生声音信号进行回音消除处理
    的步骤S22之后,包括:

    S24、通过第一麦克风获取预设的语音命令,根据所述语音命令执行对应的任务。

    如上述步骤S24所述,上述语音命令即为移动终端预设的命令,其一般会设置一个
    命令列表,该命令列表上记录有至少一个命令,每个命令对应一个指定的语音命令。比如,
    移动终端为行车记录仪,命令列表上记录“导航”、“拨打电话”、“朗读短息”等命令,其对应
    的语音命令为“导航”、“拨打电话”、“朗读短息”的汉语发音,当获取到“导航”汉语发音时,
    行车记录执行“导航”的命令进入导航页面等。本实施例中,因为将原生声音信号进行回音
    消除处理,所以语音命令被准确识别的概率提高。

    参照图2,本实施例中,上述通过第一麦克风获取预设的语音命令,根据所述语音
    命令执行对应的任务的步骤S24之后,包括:

    S25、所述任务完成指定时间长度后,控制所述移动终端输出原生音频信号至音频
    功放。

    如上述步骤S25所述,即移动终端在执行语音命令之后一定时间后,会再次自动启
    动原生音频信号输出的动作。比如,移动终端是行车记录仪,该行车记录仪在播放音乐,当
    获取到“导航”汉语发音时,行车记录执行“导航”的命令进入导航页面,过了指定时间长度
    后,移动终端自动再次启动播放音乐的动作。因为在导航过程中,并不会实时的发出导航语
    音,用户可能还是想要听音乐,当过指定时间长度后,移动终端自动再次启动播放音乐的动
    作,无需用户进行相应的操作,提高驾驶安全,同时提高用户的使用体验。上述指定时间长
    度即为时间阈值,不同的任务,其对应的时间阈值可以不同,比如,对应“导航”的时间长度
    为20秒,而对应“拨打电话”的时间长度可以为挂掉电话后的5秒等。

    参照图2,本实施例中,上述如果判定语音输入环境处于拾音状态,则将第二麦克
    风接入所述移动终端预设的第二音频输入接口的步骤S3之后,包括:

    S31、通过所述第一麦克风和第二麦克风接收外部声源的声音信号,并调用预设的
    双麦克风的降噪算法进行降噪处理。

    如上述步骤S31所述,上述双麦克风的降噪算法包括多种,常见的如一个麦克风稳
    定保持清晰通话,另一个麦克风物理主动消除噪音,通过收集外界的声音,进行处理后,发
    出与噪音相反的声波,利用抵消原理消除噪音。本实施例中会预设两种降噪算法,分别为单
    麦克风的降噪算法和双麦克风的降噪算法,这两种降噪算法根据移动终端的语音输入环境
    进行对应的切换。

    参照图2,本实施例中,上述如果判定语音输入环境处于拾音状态,则将第二麦克
    风接入所述移动终端预设的第二音频输入接口的步骤S3之后,包括:

    S32、通过第一麦克风和第二麦克风接收语音信息,并判断语音信息中是否含有第
    一关键字语音;

    S33、如果含有所述第一关键字语音,则记录所述第一麦克风和第二麦克风接收到
    第一关键字语音时的定位信息;

    S34、根据各所述麦克风的位置坐标,以及所述定位信息,计算发出所述第一关键
    字语音的声源位置。

    如上述步骤S32、S33、S34所述,上述第一关键字语音可以是某个指定的字、某个指
    定的词组或某一句指定的话等的语音,比如“你好,小新”、“我要发言”等语句的发音。判断
    语音信息中是否含有第一关键字语音的方法可以为:将所述语音信息与预设的第一关键字
    语音列表中的第一关键字语音进行匹配;如果匹配成功,则判定所述语音信息中存在第一
    关键字语音。上述定位信息即为一些接收到第一关键词语音时生成的信息,如上述的麦克
    风接收到第一关键字语音的时间、声强等。由于麦克风的位置坐标是已知的,所以根据麦克
    风的位置坐标以及指定的定位信息即可计算出声源位置。比如,利用高分辨率谱估计技术
    计算声源位置,其利用麦克风阵列所获取的声音信号计算空间谱的相关矩阵等。又或者,根
    据各麦克风的坐标和预设的音速值,计算各麦克风距离所述声源的距离,根据各麦克风接
    收到第一关键词语音的时间之差,以及各麦克风距离所述声源的距离,计算所处声源的坐
    标,即为基于声达时间差(time difference of arrival,TDOA)的定位技术,利用到达各麦
    克风的声音信号间的时间差来定位声源,再利用这些时延求得声音到达不同位置麦克风的
    距离差,最后用搜索或几何知识确定声源位置?;诘酱锸奔洳罟兰贫ㄎ环扑懔拷闲?,硬
    件成本较低,定位精度较高,同时也易于实时实现,适用于实时处理。本实施例中,由于只有
    两个麦克风,所以,会根据麦克风设置的位置,和接收第一关键词语音的时间,预估声源的
    大概方向,比如,移动终端为行车记录仪,第一麦克风和第二麦克风沿汽车的横向水平设
    置,第一麦克风靠近过司机位置,第二麦克风靠近副驾驶位置,当第一麦克风先接收到第一
    关键词语音,则可以基本判定声源的大概方向是司机位置。在其它实施例中,还可以根据第
    一麦克风和第二麦克风接收第一关键词的声强等,判断声源的位置。

    参照图2,本实施例中,上述根据各所述麦克风的位置坐标,以及所述定位信息,计
    算发出所述第一关键字语音的声源位置的步骤S34之后,包括:

    S35、根据所述声源位置,利用预设的拾音算法拾取所述声源方向的语音信息。

    如上述步骤S35所述,上述预设的拾音算法即为利用两个麦克风组成的阵列与声
    源相关性、相变和最大相似性处理等技术,从多人交谈的场合中快速定位声源方向的算法。
    这样可以最大限度的接收声源发出的声音,以提高拾取声音的准确性和使用的效率。

    本实施例中,当移动终端接收所述声源发出的第二关键字语音,解除第一麦克风
    和第二麦克风朝向所述声源方向拾音的状态。

    本实施例中,上述移动终端判断其语音输入环境所处的状态的步骤S1之前,包括:

    S10、如果接收到来电信号,则直接进入所述拾音状态。

    如上述步骤S10所述,上述来电信号即为接收到语音通讯的信号,如接听电话等,
    此时需要良好的通话环境,所以,直接进入拾音状态,使用第一麦克风和第二麦克风进行拾
    音,进行双麦克风的降噪算法,提高通话质量。

    在一具体实施例中,上述移动终端为行车记录仪,该行车记录仪上设置第一麦克
    风和第二麦克风,其中第一麦克风接入音频数模转换器的第一音频输入接口,第二麦克风
    与参考信号共用第二音频输入接口,并根据行车记录仪语音输入环境所处的状态进行切
    换。当语音输入环境处于音频输出状态时,参考信号接入所述第二音频输入接口,同时调用
    预设的单麦克风的降噪算法;当语音输入环境处于拾音状态,第二麦克风接入第二音频输
    入接口,同时调用双麦克风的降噪算法。当语音输入环境处于拾音状态,还可以根据第一关
    键字语音判断声源的位置,进而进行定向拾音,以提高语音输入的准确性等。

    本发明实施例的语音输入方法,其使用的平台一般为MT6753平台,MT6753为一种
    音频数模转换器,其自身只支持两路麦克风输入。使用本实施例的方法可以实现在移动终
    端不同状态下采用单麦克风和双麦克风拾音,保证了移动终端必备的打断功能,同时还实
    现了外部环境噪声复杂时通过双麦克风拾音,提高语音输入的准确性。而且本发明只需要
    基于两路音频输入接口完成,无需添加语音处理IC,降低移动终端的成本。

    参照图3,本发明实施例还提供一种语音输入装置,其应用于移动终端,其中,第一
    麦克风接入所述移动终端的第一音频输入接口,所述语音输入装置包括:

    判断单元10,用于移动终端判断其语音输入环境所处的状态;

    第一接入单元20,用于如果判定语音输入环境处于音频输出状态,则将参考信号
    接入所述移动终端预设的第二音频输入接口;

    第二接入单元30,用于如果判定语音输入环境处于拾音状态,则将第二麦克风接
    入所述移动终端预设的第二音频输入接口。

    如上述判断单元10、第一接入单元20和第二接入单元30,上述移动终端的语音输
    入环境一般包括两种,即音频输出状态和拾音状态。上述音频输出状态,是指移动终端本身
    输出音频的状态,如移动终端播放其自身播放的音乐音频,或者接收电台的广播音频、或者
    通过蓝牙/WIFI等通信??榻邮盏囊羝档?。上述拾音状态,是指移动终端没有输出音频信
    号,即移动终端本身并没有输出音频。本实施例中,上述移动终端的语音输入环境处于音频
    输出状态时,同样可以拾音,但是在拾音的过程中还会输出音乐等音频信号。上述参考信号
    即为移动终端采集其本身输出音频的采样信号。上述第二麦克风即为拾音装置。上述第一
    接入单元20和第二接入单元30是并列的两个并列的???,会根据语音输入环境所处的状态
    进行择一进行,也就是第一接入单元20和第二接入单元30不会同时运行。本实施例中,上述
    参考信号和第二麦克风共用同一个第二音频输入接口,根据语音输入环境所处的状态进行
    转换,在移动终端的音频数模转换器只要设置两个音频输入接口的情况下,既可以准确地
    实现音频打断功能,还可以实现双麦克风拾音,提高拾音效果。更为重要的时,无需在移动
    终端的音频数模转换器添加单独的语音处理IC,大大地减低生产成本。

    参照图4,本实施例中,上述判断单元10,包括:

    判断???1,用于判断移动终端是否输出原生音频信号至音频功放;

    判定???2,用于如果移动终端输出原生音频信号至音频功放,则判定语音输入
    环境处于所述音频输出状态;否则,判定语音输入环境处于所述拾音状态。

    如上述判断???1和判定???2,移动终端可以清楚地知道其是否发出原生音频
    信号至音频功放,如果发送,则通过判定???2判定语音输入环境处于所述音频输出状态,
    如果未发送,判定语音输入环境处于所述拾音状态,方法简单、高效,准确率高。上述原生音
    频信号即为移动终端本身发出的音频信号,或者移动终端通过蓝牙、WIFI等通讯??榻邮?br />的音频信号。即,原生音频信号不是通过麦克风拾取移动终端外部声源发出的音频信号。

    参照图5,本实施例中,上述语音输入装置,还包括:

    接收单元21,用于通过第一麦克风接收所述音频功放播放的对应所述原生音频信
    号的原生声音信号;

    消音单元22,用于根据所述参考信号对所述原生声音信号进行回音消除处理。

    如上述接收单元21和消音单元22,上述第一麦克风同样是拾音装置,其单独连接
    在移动终端的音频数模转换器上的第一音频输入接口。上述音频功放全名为音频功率放大
    器,是用于推动扬声器发声,从而重现声音的功放装置,其连接扬声器。上述原生声音信号
    即为原生音频信号通过音频功放处理后由扬声器发出的声音信号。因为原生音频信号在经
    过音频功放之前会被采样得到上述参考信号,然后参考信号与第一麦克风接收到声音信号
    进行比对,将与参考信号匹配的声音信号进行消除处理,而与参考信号匹配的信号一般即
    为上述原生声音信号,所以,当第一麦克风采集到原生声音信号和外部声源的声音信号后,
    可以将原生声音信号过滤掉,只保留外部声源的声音信号,如果外部声源的声音信号为语
    音命令时,会更容易被移动终端准确识别。

    参照图5,本实施例中,上述语音输入装置,还包括:

    第一调用单元23,用于调用预设的单麦克风的降噪算法进行降噪处理。

    如上述第一调用单元23,上述单麦克风的降噪算法包括多种,比如,预设噪音的频
    谱,在外部声源和环境音被麦克风一起拾取后,将与预设噪音的频谱相同的声音信号进行
    过滤;或者,麦克风先获取环境音并记录,当外部声源和环境音被麦克风一起拾取后,将与
    先获取记录的环境音相同或近似的声音信号消除,保留外部声源的声音信号等。

    参照图5,本实施例中,上述语音输入装置,还包括:

    获取执行单元24,用于通过第一麦克风获取预设的语音命令,根据所述语音命令
    执行对应的任务。

    如上述获取执行单元24,上述语音命令即为移动终端预设的命令,其一般会设置
    一个命令列表,该命令列表上记录有至少一个命令,每个命令对应一个指定的语音命令。比
    如,移动终端为行车记录仪,命令列表上记录“导航”、“拨打电话”、“朗读短息”等命令,其对
    应的语音命令为“导航”、“拨打电话”、“朗读短息”的汉语发音,当获取到“导航”汉语发音
    时,行车记录执行“导航”的命令进入导航页面等。本实施例中,因为将原生声音信号进行回
    音消除处理,所以语音命令被准确识别的概率提高。

    参照图5,本实施例中,上述语音输入装置,还包括:

    控制输出单元25,用于所述任务完成指定时间长度后,控制所述移动终端输出原
    生音频信号至音频功放。

    如上述控制输出单元25,即移动终端在执行语音命令之后一定时间后,会再次自
    动启动原生音频信号输出的动作。比如,移动终端是行车记录仪,该行车记录仪在播放音
    乐,当获取到“导航”汉语发音时,行车记录执行“导航”的命令进入导航页面,过了指定时间
    长度后,移动终端自动再次启动播放音乐的动作。因为在导航过程中,并不会实时的发出导
    航语音,用户可能还是想要听音乐,当过指定时间长度后,移动终端自动再次启动播放音乐
    的动作,无需用户进行相应的操作,提高驾驶安全,同时提高用户的使用体验。上述指定时
    间长度即为时间阈值,不同的任务,其对应的时间阈值可以不同,比如,对应“导航”的时间
    长度为20秒,而对应“拨打电话”的时间长度可以为挂掉电话后的5秒等。

    参照图5,本实施例中,上述语音输入装置,还包括:

    第二调用单元31,用于通过所述第一麦克风和第二麦克风接收外部声源的声音信
    号,并调用预设的双麦克风的降噪算法进行降噪处理。

    如上述第二调用单元31,上述双麦克风的降噪算法包括多种,常见的如一个麦克
    风稳定保持清晰通话,另一个麦克风物理主动消除噪音,通过收集外界的声音,进行处理
    后,发出与噪音相反的声波,利用抵消原理消除噪音。本实施例中会预设两种降噪算法,分
    别为单麦克风的降噪算法和双麦克风的降噪算法,这两种降噪算法根据移动终端的语音输
    入环境进行对应的切换。

    参照图5,本实施例中,上述语音输入装置,还包括:

    关键音判断单元32,用于通过第一麦克风和第二麦克风接收语音信息,并判断语
    音信息中是否含有第一关键字语音;

    记录单元33,用于如果含有所述第一关键字语音,则记录所述第一麦克风和第二
    麦克风接收到第一关键字语音时的定位信息;

    计算定位单元34,用于根据各所述麦克风的位置坐标,以及所述定位信息,计算发
    出所述第一关键字语音的声源位置。

    如上述关键音判断单元32、记录单元33和计算定位单元34,上述第一关键字语音
    可以是某个指定的字、某个指定的词组或某一句指定的话等的语音,比如“你好,小新”、“我
    要发言”等语句的发音。判断语音信息中是否含有第一关键字语音的方法可以为:将所述语
    音信息与预设的第一关键字语音列表中的第一关键字语音进行匹配;如果匹配成功,则判
    定所述语音信息中存在第一关键字语音。上述定位信息即为一些接收到第一关键词语音时
    生成的信息,如上述的麦克风接收到第一关键字语音的时间、声强等。由于麦克风的位置坐
    标是已知的,所以根据麦克风的位置坐标以及指定的定位信息即可计算出声源位置。比如,
    利用高分辨率谱估计技术计算声源位置,其利用麦克风阵列所获取的声音信号计算空间谱
    的相关矩阵等。又或者,根据各麦克风的坐标和预设的音速值,计算各麦克风距离所述声源
    的距离,根据各麦克风接收到第一关键词语音的时间之差,以及各麦克风距离所述声源的
    距离,计算所处声源的坐标,即为基于声达时间差的定位技术,利用到达各麦克风的声音信
    号间的时间差来定位声源,再利用这些时延求得声音到达不同位置麦克风的距离差,最后
    用搜索或几何知识确定声源位置?;诘酱锸奔洳罟兰贫ㄎ环扑懔拷闲?,硬件成本较低,
    定位精度较高,同时也易于实时实现,适用于实时处理。本实施例中,由于只有两个麦克风,
    所以,会根据麦克风设置的位置,和接收第一关键词语音的时间,预估声源的大概方向,比
    如,移动终端为行车记录仪,第一麦克风和第二麦克风沿汽车的横向水平设置,第一麦克风
    靠近过司机位置,第二麦克风靠近副驾驶位置,当第一麦克风先接收到第一关键词语音,则
    可以基本判定声源的大概方向是司机位置。在其它实施例中,还可以根据第一麦克风和第
    二麦克风接收第一关键词的声强等,判断声源的位置。

    参照图5,本实施例中,上述语音输入装置,还包括:

    定向拾音单元35,用于根据所述声源位置,利用预设的拾音算法拾取所述声源方
    向的语音信息。

    如上述定向拾音单元35,上述预设的拾音算法即为利用两个麦克风组成的阵列与
    声源相关性、相变和最大相似性处理等技术,从多人交谈的场合中快速定位声源方向的算
    法。这样可以最大限度的接收声源发出的声音,以提高拾取声音的准确性和使用的效率。

    本实施例中,当移动终端接收所述声源发出的第二关键字语音,解除第一麦克风
    和第二麦克风朝向所述声源方向拾音的状态。

    本实施例中,上述语音输入装置,还包括:

    接收进入单元,用于如果接收到来电信号,则直接进入所述拾音状态.

    如上述接收进入单元,上述来电信号即为接收到语音通讯的信号,如接听电话等,
    此时需要良好的通话环境,所以,直接进入拾音状态,使用第一麦克风和第二麦克风进行拾
    音,进行双麦克风的降噪算法,提高通话质量。

    在一具体实施例中,上述移动终端为行车记录仪,该行车记录仪上设置第一麦克
    风和第二麦克风,其中第一麦克风接入音频数模转换器的第一音频输入接口,第二麦克风
    与参考信号共用第二音频输入接口,并根据行车记录仪语音输入环境所处的状态进行切
    换。当语音输入环境处于音频输出状态时,参考信号接入所述第二音频输入接口,同时调用
    预设的单麦克风的降噪算法;当语音输入环境处于拾音状态,第二麦克风接入第二音频输
    入接口,同时调用双麦克风的降噪算法。当语音输入环境处于拾音状态,还可以根据第一关
    键字语音判断声源的位置,进而进行定向拾音,以提高语音输入的准确性等。

    本发明实施例的语音输入装置,其使用的平台一般为MT6753平台,MT6753为一种
    音频数模转换器,其自身只支持两路麦克风输入。使用本实施例的方法可以实现在移动终
    端不同状态下采用单麦克风和双麦克风拾音,保证了移动终端必备的打断功能,同时还实
    现了外部环境噪声复杂时通过双麦克风拾音,提高语音输入的准确性。而且本发明只需要
    基于两路音频输入接口完成,无需添加语音处理IC,降低移动终端的成本。

    参照图6,本发明实施例还提供一种移动终端,包括处理器100、第一麦克风501、第
    二麦克风502、模拟开关400、音频功放300、参考信号线路、以及设置第一音频输入接口和第
    二音频输入接口的音频数模转换器200;所述处理器100分别与所述模拟开关400、音频数模
    转换器200通信连接;所述音频数模转换器200通信连接所述音频功放300;所述第一麦克风
    501接入所述第一音频输入接口;所述第二麦克风502和参考信号线路连接所述模拟开关
    400;所述模拟开关400接入所述第二音频输入接口;所述处理器100接收音频数模转换器
    200的工作信号,判断所述移动终端的语音输入环境所处的状态;如果判定语音输入环境处
    于音频输出状态,则通过所述模拟开关400将所述参考信号接入所述第二音频输入接口;如
    果判定语音输入环境处于拾音状态,则通过所述模拟开关400将第二麦克风502接入所述移
    动终端预设的第二音频输入接口。

    本是实施例中,上述第一麦克风501和第二麦克风502即为拾音装置;上述音频功
    放300全名为音频功率放大器,是用于推动扬声器600发声,从而重现声音的功放装置,其连
    接扬声器600。上述参考信号线路即为将采集到的参考信号传送给音频数模转换器200的线
    路;上述第一音频输入接口和第二音频输入接口即为接收音频信号的借口等。上述模拟开
    关400即为控制第二麦克风502和参考信号线路切换的开关,其可以根据高低电平的变化而
    进行切换。上述移动终端的语音输入环境一般包括两种,即音频输出状态和拾音状态。上述
    音频输出状态,是指移动终端本身通过音频数模转换器200输出音频的状态,如移动终端播
    放其自身播放的音乐音频,或者接收电台的广播音频、或者通过蓝牙/WIFI等通信??榻邮?br />的音频等。上述拾音状态,是指移动终端没有输出音频信号,即移动终端本身并没有输出音
    频。本实施例中,上述移动终端的语音输入环境处于音频输出状态时,同样可以拾音,但是
    在拾音的过程中还会输出音乐等音频信号。上述参考信号即为移动终端采集其本身输出音
    频的采样信号。本实施例中,移动终端会根据语音输入环境所处的状态进行择一选择第二
    麦克风502和参考信号线路中的一个接入第二音频输入借口。本实施例中,上述参考信号线
    路和第二麦克风502共用同一个第二音频输入接口,根据语音输入环境所处的状态进行转
    换,在移动终端的音频数模转换器200只要设置两个音频输入接口的情况下,既可以准确地
    实现音频打断功能,还可以实现双麦克风拾音,提高拾音效果。更为重要的时,无需在移动
    终端的音频数模转换器200添加单独的语音处理IC,大大地减低生产成本。

    本实施例中,上述处理器100判断所述移动终端的语音输入环境所处的状态的方
    法,包括:判断移动终端是否输出原生音频信号至音频功放300;如果是,则判定语音输入环
    境处于所述音频输出状态;否则,判定语音输入环境处于所述拾音状态。移动终端可以清楚
    地知道其是否发出原生音频信号至音频功放300,如果发送,则判定语音输入环境处于所述
    音频输出状态,如果未发送,判定语音输入环境处于所述拾音状态,方法简单、高效,准确率
    高。上述原生音频信号即为移动终端本身发出的音频信号,或者移动终端通过蓝牙、WIFI等
    通讯??榻邮盏囊羝敌藕?。即,原生音频信号不是通过麦克风拾取移动终端外部声源发出
    的音频信号。

    本实施例中,上述处理器100判定语音输入环境处于音频输出状态后,通过所述第
    一麦克风501接收所述音频功放300播放的对应所述原生音频信号的原生声音信号;根据所
    述参考信号对所述原生声音信号进行回音消除处理。上述原生声音信号即为原生音频信号
    通过音频功放300处理后由扬声器600发出的声音信号。因为原生音频信号在经过音频功放
    300之前会被采样得到上述参考信号,然后参考信号与第一麦克风501接收到声音信号进行
    比对,将与参考信号匹配的声音信号进行消除处理,而与参考信号匹配的信号一般即为上
    述原生声音信号,所以,当第一麦克风501采集到原生声音信号和外部声源的声音信号后,
    可以将原生声音信号过滤掉,只保留外部声源的声音信号,如果外部声源的声音信号为语
    音命令时,会更容易被移动终端准确识别

    本实施例中,上述处理器100判定语音输入环境处于音频输出状态后,调用预设的
    单麦克风的降噪算法进行降噪处理。上述单麦克风的降噪算法包括多种,比如,预设噪音的
    频谱,在外部声源和环境音被麦克风一起拾取后,将与预设噪音的频谱相同的声音信号进
    行过滤;或者,麦克风先获取环境音并记录,当外部声源和环境音被麦克风一起拾取后,将
    与先获取记录的环境音相同或近似的声音信号消除,保留外部声源的声音信号等。

    本实施例中,上述处理器100通过所述第一麦克风501获取预设的语音命令,根据
    所述语音命令执行对应的任务。上述语音命令即为移动终端预设的命令,其一般会设置一
    个命令列表,该命令列表上记录有至少一个命令,每个命令对应一个指定的语音命令。比
    如,移动终端为行车记录仪,命令列表上记录“导航”、“拨打电话”、“朗读短息”等命令,其对
    应的语音命令为“导航”、“拨打电话”、“朗读短息”的汉语发音,当获取到“导航”汉语发音
    时,行车记录执行“导航”的命令进入导航页面等。本实施例中,因为将原生声音信号进行回
    音消除处理,所以语音命令被准确识别的概率提高。

    本实施例中,上述处理器100在所述任务完成指定时间长度后,控制所述音频数模
    转换器200输出原生音频信号至音频功放300。即移动终端在执行语音命令之后一定时间
    后,会再次自动启动原生音频信号输出的动作。比如,移动终端是行车记录仪,该行车记录
    仪在播放音乐,当获取到“导航”汉语发音时,行车记录执行“导航”的命令进入导航页面,过
    了指定时间长度后,移动终端自动再次启动播放音乐的动作。因为在导航过程中,并不会实
    时的发出导航语音,用户可能还是想要听音乐,当过指定时间长度后,移动终端自动再次启
    动播放音乐的动作,无需用户进行相应的操作,提高驾驶安全,同时提高用户的使用体验。
    上述指定时间长度即为时间阈值,不同的任务,其对应的时间阈值可以不同,比如,对应“导
    航”的时间长度为20秒,而对应“拨打电话”的时间长度可以为挂掉电话后的5秒等。

    本实施例中,上述处理器100判定语音输入环境处于拾音状态后,通过所述第一麦
    克风501和第二麦克风502接收外部声源的声音信号,并调用预设的双麦克风的降噪算法进
    行降噪处理。上述双麦克风的降噪算法包括多种,常见的如一个麦克风稳定保持清晰通话,
    另一个麦克风物理主动消除噪音,通过收集外界的声音,进行处理后,发出与噪音相反的声
    波,利用抵消原理消除噪音。本实施例中会预设两种降噪算法,分别为单麦克风的降噪算法
    和双麦克风的降噪算法,这两种降噪算法根据移动终端的语音输入环境进行对应的切换。

    本实施例中,上述处理器100判定语音输入环境处于拾音状态后,通过第一麦克风
    501和第二麦克风502接收语音信息,并判断语音信息中是否含有第一关键字语音;如果含
    有所述第一关键字语音,则记录所述第一麦克风501和第二麦克风502接收到第一关键字语
    音时的定位信息;根据各所述麦克风的位置坐标,以及所述定位信息,计算发出所述第一关
    键字语音的声源位置。上述第一关键字语音可以是某个指定的字、某个指定的词组或某一
    句指定的话等的语音,比如“你好,小新”、“我要发言”等语句的发音。判断语音信息中是否
    含有第一关键字语音的方法可以为:将所述语音信息与预设的第一关键字语音列表中的第
    一关键字语音进行匹配;如果匹配成功,则判定所述语音信息中存在第一关键字语音。上述
    定位信息即为一些接收到第一关键词语音时生成的信息,如上述的麦克风接收到第一关键
    字语音的时间、声强等。由于麦克风的位置坐标是已知的,所以根据麦克风的位置坐标以及
    指定的定位信息即可计算出声源位置。比如,利用高分辨率谱估计技术计算声源位置,其利
    用麦克风阵列所获取的声音信号计算空间谱的相关矩阵等。又或者,根据各麦克风的坐标
    和预设的音速值,计算各麦克风距离所述声源的距离,根据各麦克风接收到第一关键词语
    音的时间之差,以及各麦克风距离所述声源的距离,计算所处声源的坐标,即为基于声达时
    间差的定位技术,利用到达各麦克风的声音信号间的时间差来定位声源,再利用这些时延
    求得声音到达不同位置麦克风的距离差,最后用搜索或几何知识确定声源位置?;诘酱?br />时间差估计定位法计算量较小,硬件成本较低,定位精度较高,同时也易于实时实现,适用
    于实时处理。本实施例中,由于只有两个麦克风,所以,会根据麦克风设置的位置,和接收第
    一关键词语音的时间,预估声源的大概方向,比如,移动终端为行车记录仪,第一麦克风501
    和第二麦克风502沿汽车的横向水平设置,第一麦克风501靠近过司机位置,第二麦克风502
    靠近副驾驶位置,当第一麦克风501先接收到第一关键词语音,则可以基本判定声源的大概
    方向是司机位置。在其它实施例中,还可以根据第一麦克风501和第二麦克风502接收第一
    关键词的声强等,判断声源的位置。

    本实施例中,上述处理器100根据所述声源位置,利用预设的拾音算法拾取所述声
    源方向的语音信息。上述预设的拾音算法即为利用两个麦克风组成的阵列与声源相关性、
    相变和最大相似性处理等技术,从多人交谈的场合中快速定位声源方向的算法。这样可以
    最大限度的接收声源发出的声音,以提高拾取声音的准确性和使用的效率。

    本实施例中,当移动终端接收所述声源发出的第二关键字语音,解除第一麦克风
    501和第二麦克风502朝向所述声源方向拾音的状态。

    本实施例中,上述处理器100在判断所述移动终端的语音输入环境所处的状态之
    前,如果移动终端接收到来电信号,则控制移动终端直接进入所述拾音状态。上述来电信号
    即为接收到语音通讯的信号,如接听电话等,此时需要良好的通话环境,所以,直接进入拾
    音状态,使用第一麦克风501和第二麦克风502进行拾音,进行双麦克风的降噪算法,提高通
    话质量。

    在一具体实施例中,上述移动终端为行车记录仪,该行车记录仪上设置第一麦克
    风501和第二麦克风502,其中第一麦克风501接入音频数模转换器200的第一音频输入接
    口,第二麦克风502与参考信号线路共用第二音频输入接口,并根据行车记录仪语音输入环
    境所处的状态通过模拟开关400进行切换。当语音输入环境处于音频输出状态时,参考信号
    接入所述第二音频输入接口,同时调用预设的单麦克风的降噪算法;当语音输入环境处于
    拾音状态,第二麦克风502接入第二音频输入接口,同时调用双麦克风的降噪算法。当语音
    输入环境处于拾音状态,还可以根据第一关键字语音判断声源的位置,进而进行定向拾音,
    以提高语音输入的准确性等。

    本发明实施例的移动终端,其使用的平台一般为MT6753平台,MT6753为一种音频
    数模转换器200,其自身只支持两路麦克风输入。使用本实施例的方法可以实现在移动终端
    不同状态下采用单麦克风和双麦克风拾音,保证了移动终端必备的打断功能,同时还实现
    了外部环境噪声复杂时通过双麦克风拾音,提高语音输入的准确性。而且本发明只需要基
    于两路音频输入接口完成,无需添加语音处理IC,降低移动终端的成本。

    以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用
    本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关
    的技术领域,均同理包括在本发明的专利?;し段?。

    A1、一种语音输入方法,其应用于移动终端,其中,第一麦克风接入所述移动终端
    的第一音频输入接口,所述语音输入方法包括:

    所述移动终端判断其语音输入环境所处的状态;

    如果判定语音输入环境处于音频输出状态,则将参考信号接入所述移动终端预设
    的第二音频输入接口;

    如果判定语音输入环境处于拾音状态,则将第二麦克风接入所述移动终端预设的
    第二音频输入接口。

    A2、根据A1所述的语音输入方法,所述移动终端判断其语音输入环境所处的状态
    的步骤,包括:

    判断移动终端是否输出原生音频信号至音频功放;

    如果是,则判定语音输入环境处于所述音频输出状态;否则,判定语音输入环境处
    于所述拾音状态。

    A3、根据A2所述的语音输入方法,所述如果判定语音输入环境处于音频输出状态,
    则将参考信号接入所述移动终端预设的第二音频输入接口的步骤之后,包括:

    通过第一麦克风接收所述音频功放播放的对应所述原生音频信号的原生声音信
    号;

    根据所述参考信号对所述原生声音信号进行回音消除处理。

    A4、根据A3所述的语音输入方法,所述如果判定语音输入环境处于音频输出状态,
    则将参考信号接入所述移动终端预设的第二音频输入接口的步骤之后,包括:

    调用预设的单麦克风的降噪算法进行降噪处理。

    A5、根据A3所述的语音输入方法,所述根据所述参考信号对所述原生声音信号进
    行回音消除处理的步骤之后,包括:

    通过第一麦克风获取预设的语音命令,根据所述语音命令执行对应的任务。

    A6、根据A5所述的语音输入方法,所述通过第一麦克风获取预设的语音命令,根据
    所述语音命令执行对应的任务的步骤之后,包括:

    所述任务完成指定时间长度后,控制所述移动终端输出原生音频信号至音频功
    放。

    A7、根据A2所述的语音输入方法,所述如果判定语音输入环境处于拾音状态,则将
    第二麦克风接入所述移动终端预设的第二音频输入接口的步骤之后,包括:

    通过所述第一麦克风和第二麦克风接收外部声源的声音信号,并调用预设的双麦
    克风的降噪算法进行降噪处理。

    A8、根据A7所述的语音输入方法,所述如果判定语音输入环境处于拾音状态,则将
    第二麦克风接入所述移动终端预设的第二音频输入接口的步骤之后,包括:

    通过第一麦克风和第二麦克风接收语音信息,并判断语音信息中是否含有第一关
    键字语音;

    如果含有所述第一关键字语音,则记录所述第一麦克风和第二麦克风接收到第一
    关键字语音时的定位信息;

    根据各所述麦克风的位置坐标,以及所述定位信息,计算发出所述第一关键字语
    音的声源位置。

    A9、根据A8所述的语音输入方法,所述根据各所述麦克风的位置坐标,以及所述定
    位信息,计算发出所述第一关键字语音的声源位置的步骤之后,包括:

    根据所述声源位置,利用预设的拾音算法拾取所述声源方向的语音信息。

    A10、根据A1所述的语音输入方法,所述移动终端判断其语音输入环境所处的状态
    的步骤之前,包括:

    如果接收到来电信号,则直接进入所述拾音状态。

    B1、一种语音输入装置,其应用于移动终端,其中,第一麦克风接入所述移动终端
    的第一音频输入接口,所述语音输入装置包括:

    判断单元,用于移动终端判断其语音输入环境所处的状态;

    第一接入单元,用于如果判定语音输入环境处于音频输出状态,则将参考信号接
    入所述移动终端预设的第二音频输入接口;

    第二接入单元,用于如果判定语音输入环境处于拾音状态,则将第二麦克风接入
    所述移动终端预设的第二音频输入接口。

    B2、根据B1所述的语音输入装置,所述判断单元,包括:

    判断???,用于判断移动终端是否输出原生音频信号至音频功放;

    判定???,用于如果移动终端输出原生音频信号至音频功放,则判定语音输入环
    境处于所述音频输出状态;否则,判定语音输入环境处于所述拾音状态。

    B3、根据B2所述的语音输入装置,还包括:

    接收单元,用于通过第一麦克风接收所述音频功放播放的对应所述原生音频信号
    的原生声音信号;

    消音单元,用于根据所述参考信号对所述原生声音信号进行回音消除处理。

    B4、根据B3所述的语音输入装置,还包括:

    第一调用单元,用于调用预设的单麦克风的降噪算法进行降噪处理。

    B5、根据B3所述的语音输入装置,还包括:

    获取执行单元,用于通过第一麦克风获取预设的语音命令,根据所述语音命令执
    行对应的任务。

    B6、根据B5所述的语音输入装置,还包括:

    控制输出单元,用于所述任务完成指定时间长度后,控制所述移动终端输出原生
    音频信号至音频功放。

    B7、根据B2所述的语音输入装置,还包括:

    第二调用单元,用于通过所述第一麦克风和第二麦克风接收外部声源的声音信
    号,并调用预设的双麦克风的降噪算法进行降噪处理。

    B8、根据B7所述的语音输入装置,还包括:

    关键音判断单元,用于通过第一麦克风和第二麦克风接收语音信息,并判断语音
    信息中是否含有第一关键字语音;

    记录单元,用于如果含有所述第一关键字语音,则记录所述第一麦克风和第二麦
    克风接收到第一关键字语音时的定位信息;

    计算定位单元,用于根据各所述麦克风的位置坐标,以及所述定位信息,计算发出
    所述第一关键字语音的声源位置。

    B9、根据B8所述的语音输入装置,还包括:

    定向拾音单元,用于根据所述声源位置,利用预设的拾音算法拾取所述声源方向
    的语音信息。

    B10、根据B1所述的语音输入装置,还包括:

    接收进入单元,用于如果接收到来电信号,则直接进入所述拾音状态。

    C1、一种移动终端,包括处理器、第一麦克风、第二麦克风、模拟开关、音频功放、参
    考信号线路、以及设置第一音频输入接口和第二音频输入接口的音频数模转换器;

    所述处理器分别与所述模拟开关、音频数模转换器通信连接;所述音频数模转换
    器通信连接所述音频功放;所述第一麦克风接入所述第一音频输入接口;所述第二麦克风
    和参考信号线路连接所述模拟开关;所述模拟开关接入所述第二音频输入接口;

    所述处理器接收音频数模转换器的工作信号,判断所述移动终端的语音输入环境
    所处的状态;

    如果判定语音输入环境处于音频输出状态,则通过所述模拟开关将所述参考信号
    接入所述第二音频输入接口;

    如果判定语音输入环境处于拾音状态,则通过所述模拟开关将第二麦克风接入所
    述移动终端预设的第二音频输入接口。

    C2、根据C1所述的移动终端,所述处理器判断所述移动终端的语音输入环境所处
    的状态的方法,包括:

    判断移动终端是否输出原生音频信号至音频功放;如果是,则判定语音输入环境
    处于所述音频输出状态;否则,判定语音输入环境处于所述拾音状态。

    C3、根据C2所述的移动终端,所述处理器判定语音输入环境处于音频输出状态后,
    通过所述第一麦克风接收所述音频功放播放的对应所述原生音频信号的原生声音信号;根
    据所述参考信号对所述原生声音信号进行回音消除处理。

    C4、根据C3所述的移动终端,所述处理器判定语音输入环境处于音频输出状态后,
    调用预设的单麦克风的降噪算法进行降噪处理。

    C5、根据C3所述的移动终端,所述处理器通过所述第一麦克风获取预设的语音命
    令,根据所述语音命令执行对应的任务。

    C6、根据C5所述的移动终端,所述处理器在所述任务完成指定时间长度后,控制所
    述音频数模转换器输出原生音频信号至音频功放。

    C7、根据C2所述的移动终端,所述处理器判定语音输入环境处于拾音状态后,通过
    所述第一麦克风和第二麦克风接收外部声源的声音信号,并调用预设的双麦克风的降噪算
    法进行降噪处理。

    C8、根据C7所述的移动终端,所述处理器判定语音输入环境处于拾音状态后,通过
    第一麦克风和第二麦克风接收语音信息,并判断语音信息中是否含有第一关键字语音;如
    果含有所述第一关键字语音,则记录所述第一麦克风和第二麦克风接收到第一关键字语音
    时的定位信息;根据各所述麦克风的位置坐标,以及所述定位信息,计算发出所述第一关键
    字语音的声源位置。

    C9、根据C8所述的移动终端,所述处理器根据所述声源位置,利用预设的拾音算法
    拾取所述声源方向的语音信息。

    C10、根据C1所述的移动终端,所述处理器在判断所述移动终端的语音输入环境所
    处的状态之前,如果移动终端接收到来电信号,则控制移动终端直接进入所述拾音状态。

    关于本文
    本文标题:移动终端及其语音输入方法和装置.pdf
    链接地址://www.4mum.com.cn/p-6004658.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 中线股票推荐博客 股票涨跌怎么算收益 东方明珠股票 中长线股票推荐2014 内蒙古期货股票配资 股票行情 手机 昨天股票行情大盘走势 财经新闻股票行情查询上证指数大北农走势 tcl股票 北京股票配资公司 炒股融资风险 大额股票配资 上证指数计算方法 谷歌股票行情实时查询 上班炒股 《股票行情的真谛》