• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 37
    • 下载费用:20 金币  

    重庆时时彩定毒胆: 视频处理装置、视频处理方法以及设备.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201210071078.3

    申请日:

    2012.03.16

    公开号:

    CN103312938A

    公开日:

    2013.09.18

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):H04N 5/14申请日:20120316|||公开
    IPC分类号: H04N5/14; G06T7/00 主分类号: H04N5/14
    申请人: 富士通株式会社
    发明人: 李斐; 刘汝杰; 石原正树; 上原祐介
    地址: 日本神奈川县
    优先权:
    专利代理机构: 北京集佳知识产权代理有限公司 11227 代理人: 朱胜;陈炜
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201210071078.3

    授权公告号:

    ||||||

    法律状态公告日:

    2016.07.06|||2013.10.23|||2013.09.18

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明提供了视频处理装置、视频处理方法以及设备,以至少克服现有的监督式及半监督式视频处理技术存在的视频处理效果差的问题。视频处理装置包括:用于提取代表帧和进行图像分割的预处理单元;提取镜头级、帧级和区域级视觉特征的特征提取单元;构建镜头级、帧级和区域级加权图的加权图建立单元;构造代价函数的函数构造单元;通过求解代价函数的最优问题获得视频镜头、代表帧和区域的软标签的计算单元;以及根据上述软标签来进行视频处理的视频处理单元。视频处理方法用于执行能够实现上述视频处理装置的功能的处理。上述设备包括上述视频处理装置。应用本发明的上述技术,能够获得较好的视频处理效果,可以应用于视频处理领域。

    权利要求书

    权利要求书
    1.   一种视频处理装置,包括:
    预处理单元,其被配置用于分别提取视频镜头集中的每个视频镜头的至少一个代表帧,并将所提取的每个代表帧分割为多个区域,其中,所述视频镜头集的至少部分视频镜头是带标签的视频镜头;
    特征提取单元,其被配置用于提取所述视频镜头集中的每个视频镜头的镜头级视觉特征、帧级视觉特征和区域级视觉特征;
    加权图建立单元,其被配置用于根据所述镜头级视觉特征构建镜头级加权图,根据所述帧级视觉特征构建帧级加权图,以及根据所述区域级视觉特征构建区域级加权图;
    函数构造单元,其被配置用于以所述视频镜头集中的每个视频镜头的软标签、所述每个视频镜头中的每个代表帧的软标签以及所述每个代表帧中的每个区域的软标签为未知量,根据所述镜头级加权图、所述帧级加权图和所述区域级加权图的结构信息,以及根据所述每个视频镜头的软标签、所述每个代表帧的软标签以及所述每个区域的软标签之间的关系,构造代价函数;
    计算单元,其被配置用于通过求解所述代价函数的最优问题,获得所述未知量的计算值;以及
    视频处理单元,其被配置用于根据所述计算单元所获得的计算值来进行视频处理。

    2.   根据权利要求1所述的视频处理装置,所述视频处理装置是视频检索装置,其中,
    所述视频镜头集包括带标签的查询视频镜头,以及
    所述视频处理单元被配置用于根据所述计算单元所获得的计算值,将所述视频镜头集中除所述查询视频镜头之外的、与所述查询视频镜头的相似度在预定范围内的视频镜头判定为检索结果。

    3.   根据权利要求2所述的视频处理装置,其中,所述视频镜头集中除所述查询视频镜头之外的、与所述查询视频镜头的相似度在预定范围内的视频镜头是以下视频镜头中的一种:
    其软标签高于第一预设阈值的视频镜头,并且该视频镜头中具有最大软标签的代表帧的软标签高于第二预设阈值、以及该代表帧中具有最大软标签的区域的软标签高于第三预设阈值;以及
    其软标签以及其中具有最大软标签的代表帧的软标签和该代表帧中具有最大软标签的区域的软标签的三者加权和最大的前N个视频镜头,其中,N为正整数。

    4.   根据权利要求1所述的视频处理装置,所述视频处理装置是视频概念检测装置,其中,
    所述视频处理单元被配置用于根据所述计算单元所获得的结果,判定不带标签的待测视频镜头是否包含与所述视频镜头集中的带标签的视频镜头有关的语义概念。

    5.   根据权利要求4所述的视频处理装置,其中,所述视频处理单元包括:
    第一判定子单元,其被配置用于判定所述待测视频镜头是否包括在所述视频镜头集中;
    第一计算子单元,其被配置用于在所述待测视频镜头未包括在所述视频镜头集中的情况下,提取所述待测视频镜头的至少一个代表帧,并将所述待测视频镜头的每个代表帧分割为多个区域,并根据所述计算单元所获得的结果,来获得所述待测视频镜头的软标签的计算值、所述待测视频镜头中每个代表帧的软标签的计算值以及所述待测视频镜头中每个代表帧的每个区域的软标签的计算值;
    第二计算子单元,其被配置用于根据所述第一计算子单元所获得的结果,来计算所述待测视频镜头包含与所述视频镜头集中的带标签的视频镜头有关的语义概念的程度值;以及
    第二判定子单元,其被配置用于在所述第二计算子单元所计算的所述程度值大于或等于第四预设阈值的情况下判定所述待测视频镜头包含与所述视频镜头集中的带标签的视频镜头有关的语义概念,以及在所述程度值小于所述第四预设阈值的情况下判定所述待测视频镜头不包含与所述视频镜头集中的带标签的视频镜头有关的语义概念。

    6.   根据权利要求1?5中任一所述的视频处理装置,其中,所述函数构造单元包括:
    第一设定子单元,其被配置用于根据所述镜头级加权图、所述帧级加权图和所述区域级加权图的结构信息,设定这样的第一约束条件:令镜头级视觉特征越相似的两个视频镜头的软标签之间的差异越小,令帧级视觉特征越相似的两个代表帧的软标签之间的差异越小,以及令区域级视觉特征越相似的两个区域的软标签之间的差异越??;
    第二设定子单元,其被配置用于根据所述每个视频镜头的软标签、所述每个代表帧的软标签以及所述每个区域的软标签之间的关系来设定这样的第二约束条件:令带负标签的视频镜头的软标签、带负标签的视频镜头中所有代表帧的软标签以及带负标签的视频镜头中所有代表帧的所有区域的软标签尽量接近?1,令带正标签的视频镜头的软标签尽量接近1,令带正标签的视频镜头中具有最大软标签的代表帧的软标签尽量接近该代表帧所属视频镜头的软标签,以及令带正标签的视频镜头中的每个可能的正帧中具有最大软标签的区域的软标签尽量接近该区域所属代表帧的软标签;以及
    函数构造子单元,其被配置用于以所述视频镜头集中的每个视频镜头的软标签、所述视频镜头集中的每个视频镜头的每个代表帧的软标签以及所述视频镜头集中的每个视频镜头的每个代表帧的每个区域的软标签为未知量,根据所述第一约束条件和所述第二约束条件,构造代价函数。

    7.   根据权利要求6所述的视频处理装置,其中,所述可能的正帧是这样的?。?BR>该帧的软标签的值高于第五预设阈值;或
    该帧中包含有软标签高于第六预设阈值的区域。

    8.   根据权利要求1?7中任一所述的视频处理装置,其中,所述计算单元包括:
    初始化子单元,其被配置用于对所述视频镜头集中各视频镜头的软标签以及所述视频镜头集中各视频镜头中的各代表帧的软标签赋初值;
    第三计算子单元,其被配置用于根据所述视频镜头集中各视频镜头的软标签的当前值,以及根据所述视频镜头集中各视频镜头中的各代表帧的软标签的当前值,将所述代价函数转化为带约束的最小化问题,并利用带约束的凹凸过程来求解该带约束的最小化问题,以获得所述视频镜头集中各视频镜头中的各代表帧的各区域的软标签的计算值;
    第四计算子单元,其被配置用于根据所述视频镜头集中各视频镜头的软标签的当前值,以及根据所述视频镜头集中各视频镜头中的各代表帧的各区域的软标签的当前值,将所述代价函数转化为带约束的最小化问题,并利用带约束的凹凸过程来求解该带约束的最小化问题,以获得所述视频镜头集中各视频镜头中的各代表帧的软标签的计算值;
    第五计算子单元,其被配置用于根据所述视频镜头集中各视频镜头中的各代表帧的软标签的当前值,以及根据所述视频镜头集中各视频镜头中的各代表帧的各区域的软标签的当前值,利用所述代价函数进行计算来获得所述视频镜头集中各视频镜头的软标签的计算值;以及
    第三判定子单元,其被配置用于在每次第三计算子单元、第四计算子单元和第五计算子单元分别依次执行完一次计算之后,判断所述视频镜头集中各视频镜头的软标签、所述视频镜头集中各视频镜头中的各代表帧的软标签以及所述视频镜头集中各视频镜头中的各代表帧的各区域的软标签的当前值是否收敛:若是,则将所述各视频镜头的软标签、所述各代表帧的软标签以及所述各区域的软标签的当前值作为所述代价函数中的未知量的计算值保留;否则,再次利用第三计算子单元、第四计算子单元和第五计算子单元分别进行下一次迭代计算,直至第三判定子单元判定所述各视频镜头的软标签、所述各代表帧的软标签以及所述各区域的软标签的当前值收敛为止。

    9.   一种视频处理方法,包括:
    分别提取视频镜头集中的每个视频镜头的至少一个代表帧,并将所提取的每个代表帧分割为多个区域,其中,所述视频镜头集的至少部分视频镜头是带标签的视频镜头;
    提取所述视频镜头集中的每个视频镜头的镜头级视觉特征、帧级视觉特征和区域级视觉特征;
    根据所述镜头级视觉特征构建镜头级加权图,根据所述帧级视觉特征构建帧级加权图,以及根据所述区域级视觉特征构建区域级加权图;
    以所述视频镜头集中的每个视频镜头的软标签、所述每个视频镜头中的每个代表帧的软标签以及所述每个代表帧中的每个区域的软标签为未知量,根据所述镜头级加权图、所述帧级加权图和所述区域级加权图的结构信息,以及根据所述每个视频镜头的软标签、所述每个代表帧的软标签以及所述每个区域的软标签之间的关系,构造代价函数;
    通过求解所述代价函数的最优问题,获得所述未知量的计算值;以及
    根据所获得的计算值来进行视频处理。

    10.   一种设备,其包括如附记1?8中任一所述的视频处理装置。