• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 18
    • 下载费用:30 金币  

    重庆时时彩压龙虎开和: 对象识别装置、对象识别方法和程序.pdf

    关 键 词:
    对象 识别 装置 方法 程序
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201310667202.7

    申请日:

    2013.11.26

    公开号:

    CN104680123A

    公开日:

    2015.06.03

    当前法律状态:

    驳回

    有效性:

    无权

    法律详情: 发明专利申请公布后的驳回IPC(主分类):G06K 9/00申请公布日:20150603|||实质审查的生效IPC(主分类):G06K 9/00申请日:20131126|||公开
    IPC分类号: G06K9/00 主分类号: G06K9/00
    申请人: 富士通株式会社
    发明人: 刘伟; 范伟; 何源; 孙俊; 皆川明洋; 堀田悦伸
    地址: 日本神奈川县
    优先权:
    专利代理机构: 北京集佳知识产权代理有限公司11227 代理人: 王萍; 李春晖
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201310667202.7

    授权公告号:

    ||||||

    法律状态公告日:

    2018.09.14|||2015.07.01|||2015.06.03

    法律状态类型:

    发明专利申请公布后的驳回|||实质审查的生效|||公开

    摘要

    本申请公开了一种识别输入图像中的对象的装置、方法和程序,该装置包括:图像特征提取单元,被配置为提取所述输入图像中的待识别对象的图像特征;主题获取单元,被配置为基于所述图像特征采用生成主题模型获得与所述待识别对象有关的主题;语义主题模型生成单元,被配置为基于图像特征和主题生成与待识别对象有关的语义主题模型,其中,语义主题模型包括图像特征的分布以及各个图像特征相对于各个主题的分布。

    权利要求书

    权利要求书
    1.  一种识别输入图像中的对象的对象识别装置,包括:
    图像特征提取单元,被配置为提取所述输入图像中的待识别对象的图 像特征;
    主题获取单元,被配置为基于所述图像特征采用生成主题模型获得与 所述待识别对象有关的主题;
    语义主题模型生成单元,被配置为基于所述图像特征和所述主题生成 与所述待识别对象有关的语义主题模型,其中,所述语义主题模型包括所 述图像特征的分布以及各个图像特征相对于各个主题的分布;
    分类器,被配置为对所述语义主题模型进行分类,以便确定所述输入 图像中是否存在待识别对象。

    2.  根据权利要求1所述的对象识别装置,还包括:聚类单元,被配 置为对所述图像特征进行聚类,
    其中,所述主题获取单元被配置为基于所述聚类单元得到的聚类中心 采用生成主题模型获得与所述待识别对象有关的主题,以及所述语义主题 模型生成单元被配置为基于所述聚类中心和所述主题生成所述语义主题 模型,其中,所述语义主题模型包括所述聚类中心的分布以及各个聚类中 心包括的图像特征相对于各个主题的分布。

    3.  根据权利要求2所述的对象识别装置,其中,所述语义主题模型 生成单元还被配置为将各个聚类中心中包括的各个图像特征按照其所属 于的主题的特定顺序进行排列。

    4.  根据权利要求1或2所述的对象识别装置,还包括:分割单元, 被配置为在所述图像特征提取单元提取所述待识别对象的图像特征之前 对所述输入图像进行分割以获取待识别对象的候选区域,
    其中,所述图像特征提取单元被配置为针对所述候选区域提取所述待 识别对象的图像特征。

    5.  根据权利要求1或2所述的对象识别装置,其中,所述图像特征 提取单元被配置为根据特定二维分布来选择输入图像中要提取其图像特 征的位置。

    6.  根据权利要求2所述的对象识别装置,其中,所述聚类中心用词 袋方法表示,并且所述生成主题模型为潜在狄利克雷分配模型。

    7.  根据权利要求4所述的对象识别装置,其中,所述输入图像中包 括人脸和手的区域且待识别对象为手,所述分割单元包括:
    检测???,被配置为检测人脸区域,并将输入图像中其余部分作为手 的可能区域;
    阈值搜索???,被配置为搜索确定第一分割阈值,在使用所述第一分 割阈值对所述检测??榧觳獾娜肆城蚝褪值目赡芮蚪蟹指钍?,所保 留的人脸区域和手的可能区域的面积最大,且所保留的人脸区域和手的可 能区域的面积大于所述检测的人脸区域的面积;以及
    分割???,被配置为将所述第一分割阈值应用于所述手的可能区域, 并将比所述第一分割阈值小的第二分割阈值应用于所述人脸区域以获得 所述手的候选区域。

    8.  根据权利要求7所述的对象识别装置,其中,所述图像特征提取 单元被配置为针对所述手的候选区域应用二维高斯分布来选择要提取手 的图像特征的位置。

    9.  根据权利要求1或2所述的对象识别装置,其中,所述输入图像 为灰度图像或彩色图像。

    10.  一种识别输入图像中的对象的对象识别方法,包括:
    提取所述输入图像中的待识别对象的图像特征;
    基于所述图像特征采用生成主题模型获得与所述待识别对象有关的 主题;
    基于所述图像特征和所述主题生成与所述待识别对象有关的语义主 题模型,其中,所述语义主题模型包括所述图像特征的分布以及各个图像 特征相对于各个主题的分布;
    采用预定的分类器对所述语义主题模型进行分类,以便确定所述输入 图像中是否存在待识别对象。

    说明书

    说明书对象识别装置、对象识别方法和程序
    技术领域
    本申请涉及图像处理领域,具体地涉及识别图像中的对象。更具体地, 本申请涉及一种对象识别装置和方法以及程序。
    背景技术
    识别图像中的对象对于人机交互、自动控制等应用有着重要的意义。 例如,可以通过识别图像或视频输入中的人的手势来进行各种控制或触发 各种应用。在人机交互中,手势是一种重要的媒介,可以解除人们对于传 统输入输出方式的束缚,提供扩展性的手段。
    但是,在实际应用中,有些对象具有形态多变的特性,比如手势在不 同的图像中可以具有任意的形状。在这种情况下,同为对象的个体差异较 大,在识别时往往需要将对象分为若干大的类别而不完全局限于细节。因 此,期望提供一种准确的识别装置和方法。
    发明内容
    在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些 方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。 它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范 围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详 细描述的前序。
    鉴于背景技术部分所述的需求,本发明关注于如何识别图像中的形状 多变的对象。具体地,本发明提出了一种通过利用包括图像特征的分布和 图像特征相对于隐主题的分布的语义主题模型进行分类的对象识别装置 和方法,由于其有效利用了图像特征相对于隐主题的分布信息,因此可获 得更好的分类效果。
    根据本发明的一个方面,提供了一种识别输入图像中的对象的对象识 别装置,包括:图像特征提取单元,被配置为提取输入图像中的待识别对 象的图像特征;主题获取单元,被配置为基于图像特征采用生成主题模型 获得与待识别对象有关的主题;语义主题模型生成单元,被配置为基于图 像特征和主题生成与待识别对象有关的语义主题模型,其中,语义主题模 型包括图像特征的分布以及各个图像特征相对于各个主题的分布;分类 器,被配置为对语义主题模型进行分类,以便确定输入图像中是否存在待 识别对象。
    根据本发明的另一个方面,提供了一种识别输入图像中的对象的对象 识别方法,包括:提取输入图像中的待识别对象的图像特征;基于图像特 征采用生成主题模型获得与待识别对象有关的主题;基于图像特征和主题 生成与待识别对象有关的语义主题模型,其中,语义主题模型包括图像特 征的分布以及各个图像特征相对于各个主题的分布;采用预定的分类器对 语义主题模型进行分类,以便确定输入图像中是否存在待识别对象。
    依据本发明的其它方面,还提供了相应的计算机程序代码、计算机可 读存储介质和计算机程序产品。
    通过以下结合附图对本发明的优选实施例的详细说明,本发明的这些 以及其他优点将更加明显。
    附图说明
    为了进一步阐述本申请的以上和其它优点和特征,下面结合附图对本 申请的具体实施方式作进一步详细的说明。所述附图连同下面的详细说明 一起包含在本说明书中并且形成本说明书的一部分。具有相同的功能和结 构的元件用相同的参考标号表示。应当理解,这些附图仅描述本申请的典 型示例,而不应看作是对本申请的范围的限定。在附图中:
    图1是示出了根据本申请的一个实施例的对象识别装置的配置的图;
    图2示出了潜在狄利克雷分配模型的示意图;
    图3是示出了根据本申请的另一个实施例的对象识别装置的配置的 图;
    图4是根据本申请的一个实施例的对象识别装置获得的语义主题模 型的矩阵表示的一个示例;
    图5是示出了根据本申请的又一个实施例的对象识别装置的配置的 图;
    图6是示出了根据本申请的一个实施例的分割单元的配置的图;
    图7是示出了输入图像以及对该输入图像进行分割的示例的图;
    图8是示出了从图7的输入图像中分割获得的手的候选区域的示例的 图;
    图9是示出了基于二维高斯分布对图8的手的候选区域进行特征点采 样的示意图;
    图10是示出了根据本申请的一个实施例的对象识别方法的流程图;
    图11是示出了根据本申请的另一个实施例的对象识别方法的流程 图;
    图12是示出了根据本申请的又一个实施例的对象识别方法的流程 图;
    图13是示出了根据本申请的一个实施例的分割步骤的流程图;以及
    图14是其中可以实现根据本发明的实施例的方法和/或装置的通用个 人计算机的示例性结构的框图。
    具体实施方式
    在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和 简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了 解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的 决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那 些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。 此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益 于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
    在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发 明,在附图中仅仅示出了与根据本发明的方案密切相关的设备结构和/或 处理步骤,而省略了与本发明关系不大的其他细节。
    下文中的描述按如下顺序进行:
    1.对象识别装置
    2.对象识别方法
    3.用以实施本申请的装置和方法的计算设备
    [1.对象识别装置]
    首先参照图1描述根据本申请的一个实施例的对象识别装置100的结 构和功能。如图1所示,对象识别装置100包括:图像特征提取单元101, 被配置为提取输入图像中的待识别对象的图像特征;主题获取单元102, 被配置为基于图像特征采用生成主题模型获得与待识别对象有关的主题; 语义主题模型生成单元103,被配置为基于图像特征和主题生成与待识别 对象有关的语义主题模型,其中,语义主题模型包括图像特征的分布以及 各个图像特征相对于各个主题的分布;分类器104,被配置为对语义主题 模型进行分类,以便确定输入图像中是否存在待识别对象。
    具体地,对象识别装置100对输入的输入图像进行识别,以判断输入 图像中是否存在待识别的对象。该输入图像可以是通过摄像装置获取的, 也可以是从存储介质中读取的。摄像装置包括但不限于数码相机、数码摄 像机、摄像头、红外成像装置等。存储介质包括但不限于各种软盘、磁盘、 光盘、磁光盘、硬盘等计算机可读存储介质以及经由网络传输的计算机可 读信号介质。
    其中,输入图像可以是彩色图像或灰度图像。
    在接收到输入图像之后,图像特征提取单元101提取输入图像中的待 识别对象的图像特征。该图像特征例如可以是SIFT特征、SURF特征、 HOG特征等,但是不限于所列出的这些示例,而是可以采用任何能体现 图像的形状的特征。
    在一个实施例中,图像特征提取单元101被配置为根据特定二维分布 来选择输入图像中要提取其图像特征的位置,即根据特定二维分布来选择 特征点。这是由于在具体图像中,图像的特征在图像中的分布可能呈现特 定形式,例如,在中心部分的图像特征比较密集,边缘部分的图像特征比 较稀疏,通过采用相应的二维分布来选择要采样的特征点,可以在节省计 算量的同时获取尽可能多的图像特征,从而使得识别更为准确。当然,图 像特征提取单元101也可以进行均匀采样。
    图像特征提取单元101将所获得的图像特征提供给主题获取单元 102。主题获取单元102基于该图像特征采用生成主题模型获得与待识别 对象有关的主题,由于该主题一般没有明确表达,因此可以被称为隐主题。 生成主题模型包括但不限于潜在狄利克雷分配(LDA)模型、LSA(潜在 语义分析)模型、PLSA(概率潜在语义分析)模型等。
    在此,以LDA模型为例进行描述。图2示出了LDA模型的示意图。 其中,α和β分别表示狄利克雷先验参数,Z代表隐主题,W代表图像中 出现的图像特征,θ表示主题相对图像的多项式分布,表示图像特征相 对于主题的多项式分布。M、N和K分别表示图像的数量、图像特征的 数量以及隐主题的数量。关于LDA模型的具体计算是已知的,在此不再 赘述。通过该LDA模型,主题获取单元102可以获得输入图像中与待识 别对象有关的通常为多个的主题。
    然后,语义主题模型生成单元103基于上述图像特征和主题生成语义 主题模型,该语义主题模型包括图像特征的分布以及各个图像特征相对于 各个主题的分布,分类器104基于该语义主题模型进行分类从而识别输入 图像中的对象。与仅使用图像特征的分布进行识别的方式以及仅使用主题 的分布进行识别的方式相比,由于语义主题模型还利用了图像特征相对于 主题的分布情况,因此分类结果更为准确。
    分类器104可以使用已有的各种分类器,包括但不限于支持向量机、 决策树等。
    在另一个实施例中,提供了对象识别装置200,如图3所示,除了对 象识别装置100中的各个单元之外,对象识别装置200还包括聚类单元 201,被配置为对图像特征进行聚类,其中,主题获取单元102被配置为 基于聚类单元201得到的聚类中心采用生成主题模型获得与待识别对象 有关的主题,以及语义主题模型生成单元103被配置为基于聚类中心和主 题生成语义主题模型,其中,语义主题模型包括聚类中心的分布以及各个 聚类中心包括的图像特征相对于各个主题的分布。
    如上所述,通过聚类获得多个聚类中心,每个聚类中心对应于一个或 更多个图像特征。聚类的方法包括但不限于K-means、K-medoids、分层 K-means方法等。
    使用与参照图2描述的LDA模型相同的LDA模型,基于聚类中心 来获得主题。需要注意的是,此时N仍表示图像特征的数量。通过该LDA 模型,主题获取单元102可以获得输入图像中与待识别对象有关的多个主 题。
    如上所述,语义主题模型生成单元103获得的语义主题模型包括聚类 中心的分布以及各个聚类中心中各个图像特征相对于各个主题的分布。例 如,可以用图4所示的矩阵进行表示,其中,○□☆分别表示各个主题。 因此,对于每一个图像而言,可以获知其中各个主题的分布情况、各个聚 类中心的分布情况以及各个聚类中心中包括的图像特征的主题分布?;谎?之,可以获得各个聚类中心的类内差异的信息,从而实际上获得M×(K ×V)的矩阵,其中V是聚类中心的数目。
    对于每一幅图像,其矩阵维数为K×V,可以对其进行归一化并作为 分类器的输入。由于语义主题模型考虑了聚类中心的类内差异,因此与仅 使用聚类中心的分布进行分类的方式以及仅使用主题的分布进行分类的 方式相比,分类结果更为准确。
    此外,为了便于统计对应于每个主题的图像特征的数量,语义主题模 型生成单元103还被配置为将各个聚类中心中包括的图像特征按照其所 属于的主题的特定顺序进行排列。例如,将图像特征按照主题○□☆的顺 序进行排列,则图4中所示的图像M中的聚类中心V对应的主题序列应 变为“○○○..□”。
    在一个实施例中,聚类中心用词袋(Bag of Words)方法表示,并且 生成主题模型为LDA模型。具体地,在训练过程中,将所有图像中的图 像特征经过聚类得到视觉词汇词典。然后,将图像特征指派到最近邻的视 觉词汇、即聚类中心,这样,每一幅图像可以用视觉词汇的直方图来进行 特征表示。与LDA模型以及语义主题模型相关的其他描述与上述参照图 2和图4所述的相同,在此不再重复。
    在很多情况下,图像除了包括待识别对象之外,还包括其他部分,因 此,可能需要首先将可能包括待识别对象的图像区域划分出来,然后对于 该可能区域中的图像进行判断。
    因此,图5所示的对象识别装置300除了参照图1所述的对象识别装 置100中的各个单元之外还包括:分割单元301,被配置为在图像特征提 取单元101提取待识别对象的图像特征之前对输入图像进行分割以获取 待识别对象的候选区域,其中,图像特征提取单元101被配置为针对该候 选区域提取待识别对象的图像特征。此外,对象识别装置300还可以包括 参照图2所述的聚类单元201,在图5中用虚线示出。
    分割单元301通?;谑淙胪枷裰写侗鸲韵笄蚝推渌蛑?具有某一方面的区分度。例如,当输入图像为灰度图像比如红外图像时, 灰度值随着目标距离摄像头的距离不同而变化。通常情况下,距离摄像头 越近,灰度值越小,相应的图像区域看起来越亮,反之则看起来越暗,从 而可以根据灰度值的大小来进行分割,例如可以设定阈值以使得将灰度高 于或低于该阈值的图像区域作为候选区域。对于彩色图像,例如可以根据 亮度来进行分割。
    应该理解,这里虽然示出了灰度和亮度作为分割的依据,但是并不限 于此,而是可以根据要识别的对象和输入图像的特征进行适当选择。
    在一个实施例中,输入图像中包括人脸和手的区域且待识别对象为 手,如图6所示,分割单元301包括:检测???001,被配置为检测人 脸区域,并将输入图像中其余部分作为手的可能区域;阈值搜索???3002,被配置为搜索确定第一分割阈值,在使用第一分割阈值分别对检测 ???001检测的人脸区域和手的可能区域进行分割时,所保留的人脸区 域和手的可能区域的面积最大,且所保留的人脸区域和手的可能区域的面 积大于检测的人脸区域的面积;以及分割???003,被配置为将预定的 第一分割阈值应用于手的可能区域,并将比预定的第一分割阈值小的第二 分割阈值应用于人脸区域以获得手的候选区域。
    在手势识别中,例如使用红外摄像头来检测图像中的手势,通常情况 下,手位于人脸前方以进行人机交互中的命令发送。因此,手的区域的灰 度值被认为比人脸的灰度值要小,即看起来更亮,而图像中其余的亮度区 域被认为是面部。
    由于人脸较为容易检测,因此首先检测图像中的人脸区域,并将其余 部分作为手的可能区域,这里可以使用任何人脸检测方法进行检测。如图 7所示,上部为输入图像,其中,白框限定了检测到的人脸区域。
    接下来,阈值搜索???002可以根据下式(1)来搜索确定第一分割 阈值k。
    k = arg max t ( H hand ( 255 ) - H hand ( t ) + H face ( 0 ) - H face ( t ) ) - - - ( 1 ) ]]>
    Hhand(255)-Hhand(t)+Hface(0)-Hface(t)>Hface(0)*(1+ε)
                                                                      (2)
    其中,输入图像的灰度值为0-255。t是用于分别对人脸区域和手的 可能区域进行分割的阈值。Hhand和Hface分别代表手的区域和人脸区域的 累积灰度直方图。因为人脸区域包括相对多的暗像素,手的区域包括相对 多的亮像素,因此,认为Hhand(255)-Hhand(t)可以表示手的区域的面积, 而Hface(0)-Hface(t)可以表示人脸的区域的面积,式(1)的含义为改变分 割阈值t以使得所保留的人脸区域和手的区域的面积最大并将此时的阈值 t作为第一分割阈值k。同时,在进行分割时选取的t应该满足式(2)的 条件,即所保留的人脸区域和手的可能区域的面积总和大于检测???3001检测的人脸区域、即白框中的区域的面积,其中,ε是一个经验小 值且ε为正值。
    在确定了第一分割阈值k之后,分割???003使用该阈值k基于下 式(3)对输入图像进行分割。

    其中,d是根据经验确定的正值。通过使人脸区域的分割阈值thre 小于手的区域的分割阈值k,可以保留人脸区域内的更多的与手相似的有 效信息。
    这样,就获得了分割后的手的候选区域。此外,还可以执行噪声去除 以去除面积较小的连通区域而保留最大面积的连通区域作为最终的手的 候选区域。图8示出了如上所述的分割单元301对图7中的输入图像进行 分割后获得的手的候选区域的图。
    然后,图像特征提取单元101、主题获取单元102、语义主题模型生 成单元103、分类器104和聚类单元201可以针对该候选区域执行与参照 图1至4描述的操作相同的操作,在此省略其描述。
    此外,图像特征提取单元101还可以被配置为针对手的候选区域应用 二维高斯分布来选择要提取手的图像特征的位置。由于手的候选区域是手 的外接矩形框,如图8所示,特征点的分布可以被假设为以矩形框中心为 中心的高斯分布。因此,可以采用一种基于高斯分布约束的密集特征采样 方式来进行特征提取,如图9所示,其中的小圆圈代表采样位置。
    应该理解,虽然以上示出了输入图像为红外图像且待识别对象为手的 实施例,但是本申请可以应用的范围不限于此,而是也可以用于输入图像 为彩色图像以及/或者待识别对象为其他类别的对象的情形。
    综上所述,根据本申请的实施例的对象识别装置100、200和300通 过基于包括图像特征的分布和图像特征相对于主题的分布的语义主题模 型来进行分类,更全面地利用了各种信息,从而可以获得更加准确的分类 结果。
    [2.对象识别方法]
    以上结合附图描述了根据本发明的对象识别装置的实施方式,在此过 程中事实上也描述了一种对象识别方法。下面对所述方法结合附图10至 13予以简要描述,其中的细节可参见前文对对象处理装置的描述。
    如图10所示,根据本申请的一个实施例的识别输入图像中的对象的 对象识别方法包括如下步骤:提取输入图像中的待识别对象的图像特征 (S11);基于图像特征采用生成主题模型获得与待识别对象有关的主题 (S12);基于图像特征和主题生成与待识别对象有关的语义主题模型 (S13),其中,语义主题模型包括图像特征的分布以及各个图像特征相对 于各个主题的分布;以及采用预定的分类器对语义主题模型进行分类,以 便确定输入图像中是否存在待识别对象(S14)。
    其中,输入图像可以为灰度图像。输入图像也可以为彩色图像,且图 像特征为亮度特征。
    在一个实施例中,在步骤S11中可以根据特定二维分布来选择输入图 像中要提取其图像特征的位置。常用的二维分布例如包括高斯分布等,但 是并不限于此,而是可以根据待识别对象的特征来选取。
    所采用的分类器可以为支持向量机、决策树等,但是并不限于此,而 是可以采用任何已有的分类器。
    图11示出了对象识别方法的另一个实施例,该对象识别方法包括: 提取输入图像中的待识别对象的图像特征(S11);对图像特征进行聚类 (S21);基于所述聚类得到的聚类中心采用生成主题模型获得与所述待识 别对象有关的主题(S22);基于聚类中心和主题生成语义主题模型(S23), 其中,语义主题模型包括聚类中心的分布以及各个聚类中心包括的图像特 征相对于各个主题的分布;以及采用预定的分类器对语义主题模型进行分 类,以便确定输入图像中是否存在待识别对象(S14)。
    其中,步骤S11和步骤S14与参照图10描述的对象识别方法中的步 骤S11和S14相同。步骤S22和步骤S23与步骤S12和步骤S13类似, 只是用聚类中心代替了图像特征,这样可以获得更好的效果且显著减小计 算量。
    在一个实施例中,聚类中心用词袋方法表示,并且生成主题模型为 LDA模型。但是,生成主题模型并不限于此,还可以是LSA、PLSA等。
    在根据该方法获得的语义主题模型中,还可以将各个聚类中心中包括 的各个图像特征按照其所属于的主题的特定顺序进行排列,以便于统计各 个主题的图像特征的数量。
    图12示出了根据本申请的另一个实施例的对象识别方法的流程图, 该方法在图10或图11的方法的步骤S11之前还包括如下步骤:对输入图 像进行分割以获取待识别对象的候选区域(S31),其中,在步骤S11中针 对候选区域提取待识别对象的图像特征。步骤S21的框为虚线,表示如果 执行图10所示的方法,则该步骤跳过。图12的其他步骤与图10和图11 中的相应步骤相同,在此不再重复。
    在一个实施例中,输入图像中包括人脸和手的区域且待识别对象为 手,如图13所示,分割的步骤S31包括以下子步骤:检测人脸区域(S311), 并将输入图像中其余部分作为手的可能区域;搜索确定第一分割阈值 (S312),在使用该第一分割阈值分别对检测的人脸区域和手的可能区域 进行分割时,所保留的人脸区域和手的可能区域的面积最大,且所保留的 人脸区域和手的可能区域的面积大于检测的人脸区域的面积;以及将预定 的第一分割阈值应用于手的可能区域,并将比预定的第一分割阈值小的第 二分割阈值应用于人脸区域以获得手的候选区域(S313)。
    在分割步骤S31完成后,在提取手的候选区域中的图像特征的步骤 S11中应用二维高斯分布来选择要提取其图像特征的位置。
    通过应用本申请的上述各种对象识别方法,可以获得更准确的识别结 果。此外,虽然没有具体描述,但是,本领域的技术人员应该理解,在训 练所使用的分类器时使用与以上参照图10-13所描述的相同的方法。
    以上实施例中的相关细节已经在对对象识别装置的描述中详细给出, 在此不再赘述。
    [3.用以实施本申请的装置和方法的计算设备]
    上述装置中各个组成???、单元可通过软件、固件、硬件或其组合的 方式进行配置。配置可使用的具体手段或方式为本领域技术人员所熟知, 在此不再赘述。在通过软件或固件实现的情况下,从存储介质或网络向具 有专用硬件结构的计算机(例如图14所示的通用计算机1400)安装构成 该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
    在图14中,中央处理单元(CPU)1401根据只读存储器(ROM) 1402中存储的程序或从存储部分1408加载到随机存取存储器(RAM) 1403的程序执行各种处理。在RAM1403中,也根据需要存储当CPU1401 执行各种处理等等时所需的数据。CPU1401、ROM1402和RAM1403 经由总线1404彼此连接。输入/输出接口1405也连接到总线1404。
    下述部件连接到输入/输出接口1405:输入部分1406(包括键盘、鼠 标等等)、输出部分1407(包括显示器,比如阴极射线管(CRT)、液 晶显示器(LCD)等,和扬声器等)、存储部分1408(包括硬盘等)、 通信部分1409(包括网络接口卡比如LAN卡、调制解调器等)。通信部 分1409经由网络比如因特网执行通信处理。根据需要,驱动器1410也可 连接到输入/输出接口1405??梢瞥橹?411比如磁盘、光盘、磁光盘、 半导体存储器等等根据需要被安装在驱动器1410上,使得从中读出的计 算机程序根据需要被安装到存储部分1408中。
    在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介 质比如可移除介质1411安装构成软件的程序。
    本领域的技术人员应当理解,这种存储介质不局限于图14所示的其 中存储有程序、与设备相分离地分发以向用户提供程序的可移除介质 1411??梢瞥橹?411的例子包含磁盘(包含软盘(注册商标))、光 盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光 盘(包含迷你盘(MD)(注册商标))和半导体存储器?;蛘?,存储介 质可以是ROM1402、存储部分1408中包含的硬盘等等,其中存有程序, 并且与包含它们的设备一起被分发给用户。
    本发明还提出一种存储有机器可读取的指令代码的程序产品。所述指 令代码由机器读取并执行时,可执行上述根据本发明实施例的方法。
    相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存 储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、 磁光盘、存储卡、存储棒等等。
    最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体 意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品 或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者 是还包括为这种过程、方法、物品或者设备所固有的要素。此外,在没有 更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包 括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
    以上虽然结合附图详细描述了本发明的实施例,但是应当明白,上面 所描述的实施方式只是用于说明本发明,而并不构成对本发明的限制。对 于本领域的技术人员来说,可以对上述实施方式作出各种修改和变更而没 有背离本发明的实质和范围。因此,本发明的范围仅由所附的权利要求及 其等效含义来限定。
    通过上述的描述,本发明的实施例提供了以下的技术方案,但不限于 此。
    附记1.一种识别输入图像中的对象的对象识别装置,包括:
    图像特征提取单元,被配置为提取所述输入图像中的待识别对象的图 像特征;
    主题获取单元,被配置为基于所述图像特征采用生成主题模型获得与 所述待识别对象有关的主题;
    语义主题模型生成单元,被配置为基于所述图像特征和所述主题生成 与所述待识别对象有关的语义主题模型,其中,所述语义主题模型包括所 述图像特征的分布以及各个图像特征相对于各个主题的分布;
    分类器,被配置为对所述语义主题模型进行分类,以便确定所述输入 图像中是否存在待识别对象。
    附记2.根据附记1所述的对象识别装置,还包括:聚类单元,被配 置为对所述图像特征进行聚类,
    其中,所述主题获取单元被配置为基于所述聚类单元得到的聚类中心 采用生成主题模型获得与所述待识别对象有关的主题,以及所述语义主题 模型生成单元被配置为基于所述聚类中心和所述主题生成所述语义主题 模型,其中,所述语义主题模型包括所述聚类中心的分布以及各个聚类中 心包括的图像特征相对于各个主题的分布。
    附记3.根据附记2所述的对象识别装置,其中,所述语义主题模型 生成单元还被配置为将各个聚类中心中包括的各个图像特征按照其所属 于的主题的特定顺序进行排列。
    附记4.根据附记1或2所述的对象识别装置,还包括:分割单元, 被配置为在所述图像特征提取单元提取所述待识别对象的图像特征之前 对所述输入图像进行分割以获取待识别对象的候选区域,
    其中,所述图像特征提取单元被配置为针对所述候选区域提取所述待 识别对象的图像特征。
    附记5.根据附记1或2所述的对象识别装置,其中,所述图像特征 提取单元被配置为根据特定二维分布来选择输入图像中要提取其图像特 征的位置。
    附记6.根据附记2所述的对象识别装置,其中,所述聚类中心用词 袋方法表示,并且所述生成主题模型为潜在狄利克雷分配模型。
    附记7.根据附记4所述的对象识别装置,其中,所述输入图像中包 括人脸和手的区域且待识别对象为手,所述分割单元包括:
    检测???,被配置为检测人脸区域,并将输入图像中其余部分作为手 的可能区域;
    阈值搜索???,被配置为搜索确定第一分割阈值,在使用所述第一分 割阈值分别对所述检测??榧觳獾娜肆城蚝褪值目赡芮蚪蟹指钍?, 所保留的人脸区域和手的可能区域的面积最大,且所保留的人脸区域和手 的可能区域的面积大于所述检测的人脸区域的面积;以及
    分割???,被配置为将所述第一分割阈值应用于所述手的可能区域, 并将比所述第一分割阈值小的第二分割阈值应用于所述人脸区域以获得 所述手的候选区域。
    附记8.根据附记7所述的对象识别装置,其中,所述图像特征提取 单元被配置为针对所述手的候选区域应用二维高斯分布来选择要提取手 的图像特征的位置。
    附记9.根据附记1或2所述的对象识别装置,其中,所述输入图像 为灰度图像或彩色图像。
    附记10.根据附记1或2所述的对象识别装置,其中,所述分类器 为支持向量机或决策树。
    附记11.一种识别输入图像中的对象的对象识别方法,包括:
    提取所述输入图像中的待识别对象的图像特征;
    基于所述图像特征采用生成主题模型获得与所述待识别对象有关的 主题;
    基于所述图像特征和所述主题生成与所述待识别对象有关的语义主 题模型,其中,所述语义主题模型包括所述图像特征的分布以及各个图像 特征相对于各个主题的分布;
    采用预定的分类器对所述语义主题模型进行分类,以便确定所述输入 图像中是否存在待识别对象。
    附记12.根据附记11所述的对象识别方法,还包括:对所述图像特 征进行聚类,
    其中,基于所述聚类得到的聚类中心采用生成主题模型获得与所述待 识别对象有关的主题,以及基于所述聚类中心和所述主题生成所述语义主 题模型,其中,所述语义主题模型包括所述聚类中心的分布以及各个聚类 中心包括的图像特征相对于各个主题的分布。
    附记13.根据附记12所述的对象识别方法,还包括:在所述语义主 题模型中,将各个聚类中心中包括的各个图像特征按照其所属于的主题的 特定顺序进行排列。
    附记14.根据附记11或12所述的对象识别方法,还包括:在提取 所述待识别对象的图像特征之前对所述输入图像进行分割以获取待识别 对象的候选区域,其中,针对所述候选区域提取所述待识别对象的图像特 征。
    附记15.根据附记11或12所述的对象识别方法,还包括:在提取 所述待识别对象的图像特征时根据特定二维分布来选择输入图像中要提 取其图像特征的位置。
    附记16.根据附记11或12所述的对象识别方法,其中,所述聚类 中心用词袋方法表示,并且所述生成主题模型为潜在狄利克雷分配模型。
    附记17.根据附记14所述的对象识别方法,其中,所述输入图像中 包括人脸和手的区域且待识别对象为手,所述分割的步骤包括:
    检测人脸区域,并将输入图像中其余部分作为手的可能区域;
    搜索确定第一分割阈值,在使用所述第一分割阈值分别对检测的人脸 区域和手的可能区域进行分割时,所保留的人脸区域和手的可能区域的面 积最大,且所保留的人脸区域和手的可能区域的面积大于所述检测的人脸 区域的面积;以及
    将所述第一分割阈值应用于所述手的可能区域,并将比所述第一分割 阈值小的第二分割阈值应用于所述人脸区域以获得所述手的候选区域。
    附记18.根据附记17所述的对象识别方法,还包括:在提取所述手 的候选区域中的图像特征时应用二维高斯分布来选择要提取其图像特征 的位置。
    附记19.根据附记11或12所述的对象识别装置,其中,所述分类 器为支持向量机或决策树。
    附记20.一种训练用于识别输入图像中的对象的分类器的方法,包 括:
    针对训练图像集中的每一个样本图像,提取所述样本图像中的待识别 对象的图像特征;
    基于所述图像特征采用生成主题模型获得与所述待识别对象有关的 主题;
    基于所述图像特征和所述主题生成与所述待识别对象有关的语义主 题模型,其中,所述语义主题模型包括所述图像特征的分布以及各个图像 特征相对于各个主题的分布;以及
    基于所获得的针对各个样本图像的语义主题模型进行训练,以便获得 能够确定所述训练图像集中的每一个样本图像中是否存在待识别对象的 分类器。

    关于本文
    本文标题:对象识别装置、对象识别方法和程序.pdf
    链接地址://www.4mum.com.cn/p-5887122.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 湖北快3官网 后一大小单双稳赚翻倍技巧 澳洲幸运10哪里有走势图 七乐彩走势图2元网 4高手论坛 山西11选5 幸运飞艇6码倍投是几倍 波克棋牌赢话费下载 江湖地摊皮手套赚钱吗 贵州快3开奖公告 百搭二王官方旗舰厅 万人龙虎怎么赢 河南481客户端 到底有没有稳定的飞艇计划 乘风棋牌下载 社区团长团购怎么赚钱的