• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 14
    • 下载费用:30 金币  

    重庆时时彩网上投注平台犯法吗: 行人检测的方法及装置.pdf

    关 键 词:
    行人 检测 方法 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201710064338.7

    申请日:

    2017.02.04

    公开号:

    CN106803083A

    公开日:

    2017.06.06

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 著录事项变更IPC(主分类):G06K 9/00变更事项:申请人变更前:北京旷视科技有限公司变更后:北京旷视科技有限公司变更事项:地址变更前:100190 北京市海淀区科学院南路2号A座313变更后:100190 北京市海淀区科学院南路2号A座313变更事项:申请人变更前:北京小孔科技有限公司变更后:北京迈格威科技有限公司|||实质审查的生效IPC(主分类):G06K 9/00申请日:20170204|||公开
    IPC分类号: G06K9/00; G06N3/04 主分类号: G06K9/00
    申请人: 北京旷视科技有限公司; 北京小孔科技有限公司
    发明人: 肖特特; 茅佳源
    地址: 100190 北京市海淀区科学院南路2号A座313
    优先权:
    专利代理机构: 北京市磐华律师事务所 11336 代理人: 高伟;刘爱平
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201710064338.7

    授权公告号:

    ||||||

    法律状态公告日:

    2017.08.18|||2017.06.30|||2017.06.06

    法律状态类型:

    著录事项变更|||实质审查的生效|||公开

    摘要

    本发明实施例提供了一种行人检测的方法,包括:接收待检测图片;采用神经网络,确定所述待检测图片中的行人信息,所述行人信息包括行人的位置以及所述行人的关键点位置;对所述待检测图片中的所述行人信息进行后处理,得到所述行人检测的结果。由此可见,本发明实施例对于待检测图片,可以采用神经网络,得到行人位置和行人的关键点信息,这样通过引入行人的关键点信息,解决了传统行人检测方法中难以解决的遮挡和重叠问题,提升了检测的精确度。

    权利要求书

    1.一种行人检测的方法,其特征在于,包括:
    接收待检测图片;
    采用神经网络,确定所述待检测图片中的行人信息,所述行人信息包括行人的位置以
    及所述行人的关键点位置;
    对所述待检测图片中的所述行人信息进行后处理,得到所述行人检测的结果。
    2.如权利要求1所述的方法,其特征在于,所述行人的关键点位置包括以下中的至少一
    项:
    头部位置、左肩位置、右肩位置、左膝位置、右膝位置、左脚位置、右脚位置。
    3.如权利要求1或2所述的方法,其特征在于,所述对所述待检测图片中的所述行人信
    息进行后处理,得到所述行人检测的结果,包括:
    对所述待检测图片中的所述行人信息进行过滤,得到所述行人信息中的高概率行人信
    息;
    对所述高概率行人信息进行处理,得到所述行人检测的结果,
    其中,所述高概率行人信息为概率值大于或等于概率阈值的行人信息,所述概率阈值
    为预设概率值。
    4.如权利要求3所述的方法,其特征在于,所述对所述高概率行人信息进行处理,得到
    所述行人检测的结果,包括:
    根据所述高概率行人信息中的所述行人的关键点位置,得到所述行人检测的结果。
    5.如权利要求4所述的方法,其特征在于,所述根据所述高概率行人信息中的所述行人
    的关键点位置,得到所述行人检测的结果,包括:
    根据所述高概率行人信息中的相邻的两个所述行人信息中所述关键点的空间位置与
    距离确定所述相邻的两个所述行人信息是否属于同一行人,以得到所述行人检测的结果。
    6.如权利要求5所述的方法,其特征在于,所述根据所述高概率行人信息中的相邻的两
    个所述行人信息中所述关键点的空间位置与距离确定所述相邻的两个所述行人信息是否
    属于同一行人,以得到所述行人检测的结果,包括:
    根据所述高概率行人信息中的相邻的两个所述行人信息中所述关键点的空间位置与
    距离确定所述相邻的两个所述行人信息是否属于同一行人,若所述相邻的两个所述行人信
    息属于同一行人,则利用非最大抑制方法,对所述相邻的两个所述行人信息进行合并操作,
    得到所述行人检测的结果。
    7.如权利要求1至6任一项所述的方法,其特征在于,在所述方法之前,还包括:
    基于至少一张训练图像,通过训练得到所述神经网络;
    其中,所述训练图像中标注有行人信息。
    8.一种行人检测的装置,其特征在于,包括:
    接收???,用于接收待检测图片;
    确定???,用于采用神经网络,确定所述待检测图片中的行人信息,所述行人信息包括
    行人的位置以及所述行人的关键点位置;
    后处理???,用于对所述待检测图片中的所述行人信息进行后处理,得到所述行人检
    测的结果。
    9.如权利要求8所述的装置,其特征在于,所述行人的关键点位置包括以下中的至少一
    项:
    头部位置、左肩位置、右肩位置、左膝位置、右膝位置、左脚位置、右脚位置。
    10.如权利要求8或9所述的装置,其特征在于,所述后处理???,包括:
    过滤子???,用于对所述待检测图片中的所述行人信息进行过滤,得到所述行人信息
    中的高概率行人信息;
    处理子???,用于对所述高概率行人信息进行处理,得到所述行人检测的结果,
    其中,所述高概率行人信息为概率值大于或等于概率阈值的行人信息,所述概率阈值
    为预设概率值。
    11.如权利要求10所述的装置,其特征在于,所述处理子???,用于:
    根据所述高概率行人信息中的所述行人的关键点位置,得到所述行人检测的结果。
    12.如权利要求11所述的装置,其特征在于,所述处理子???,用于:
    根据所述高概率行人信息中的相邻的两个所述行人信息中所述关键点的空间位置与
    距离确定所述相邻的两个所述行人信息是否属于同一行人,以得到所述行人检测的结果。
    13.如权利要求12所述的装置,其特征在于,所述处理子???,用于:
    根据所述高概率行人信息中的相邻的两个所述行人信息中所述关键点的空间位置与
    距离确定所述相邻的两个所述行人信息是否属于同一行人,若所述相邻的两个所述行人信
    息属于同一行人,则利用非最大抑制方法,对所述相邻的两个所述行人信息进行合并操作,
    得到所述行人检测的结果。
    14.如权利要求8至13任一项所述的装置,其特征在于,还包括训练???,用于:
    基于至少一张训练图像,通过训练得到所述神经网络;
    其中,所述训练图像中标注有行人信息。

    说明书

    行人检测的方法及装置

    技术领域

    本发明涉及图像识别领域,更具体地涉及一种行人检测的方法及装置。

    背景技术

    行人检测是通用物体检测的子问题,吸引了学术界和工业界的大量兴趣。首先,行
    人检测可以应用于安防、自动(辅助)驾驶、智能监控和人机交互等多个领域,是一项基本且
    重要的技术。

    现有的行人检测无法解决遮挡、人体重叠等问题。遮挡,指由于存在障碍物导致目
    标只有部分可见,常见的遮挡后果是人体只有上(下)半身或左(右)半身可见。人体重叠,指
    两人及以上在图片中的位置关系发生重合,常见的人体重叠多见于人群较为密集的场景。

    遮挡及重叠是行人检测中最棘手的两个问题。部分不可见会降低传统行人检测方
    法的检出率;重叠对技术的要求则更高,因为对于重叠的人,神经网络更倾向于将两人(甚
    至多人)检测为同一个人,即不能将重叠的目标划分开来。同时,现有的行人检测技术通常
    需要在后期处理中运用“非最大抑制”的方法?!胺亲畲笠种啤笔俏舜砩窬缍酝桓?br />人报出两次(或多次)检测,因此需对多个空间位置接近的检测结果进行合并。在重叠的情
    况下,非最大抑制还会导致对不同目标的检测结果被误合并。

    发明内容

    考虑到上述问题而提出了本发明。本发明提供了一种行人检测的方法,能够在基
    于待检测图片中的行人信息,得到行人检测的结果,从而能够提高行人检测的精度。

    根据本发明的第一方面,提供了一种行人检测的方法,包括:

    接收待检测图片;

    采用神经网络,确定所述待检测图片中的行人信息,所述行人信息包括行人的位
    置以及所述行人的关键点位置;

    对所述待检测图片中的所述行人信息进行后处理,得到所述行人检测的结果。

    示例性地,所述行人的关键点位置包括以下中的至少一项:头部位置、左肩位置、
    右肩位置、左膝位置、右膝位置、左脚位置、右脚位置。

    示例性地,所述对所述待检测图片中的所述行人信息进行后处理,得到所述行人
    检测的结果,包括:

    对所述待检测图片中的所述行人信息进行过滤,得到所述行人信息中的高概率行
    人信息;

    对所述高概率行人信息进行处理,得到所述行人检测的结果,

    其中,所述高概率行人信息为概率值大于或等于概率阈值的行人信息,所述概率
    阈值为预设概率值。

    示例性地,所述对所述高概率行人信息进行处理,得到所述行人检测的结果,包
    括:根据所述高概率行人信息中的所述行人的关键点位置,得到所述行人检测的结果。

    示例性地,所述根据所述高概率行人信息中的所述行人的关键点位置,得到所述
    行人检测的结果,包括:根据所述高概率行人信息中的相邻的两个所述行人信息中所述关
    键点的空间位置与距离确定所述相邻的两个所述行人信息是否属于同一行人,以得到所述
    行人检测的结果。

    示例性地,所述根据所述高概率行人信息中的所述行人的关键点位置,得到所述
    行人检测的结果,包括:根据所述高概率行人信息中的相邻的两个所述行人信息中所述关
    键点的空间位置与距离确定所述相邻的两个所述行人信息是否属于同一行人,若所述相邻
    的两个所述行人信息属于同一行人,则利用非最大抑制方法,对所述相邻的两个所述行人
    信息进行合并操作,得到所述行人检测的结果。

    示例性地,在所述方法之前,还包括:基于至少一张训练图像,通过训练得到所述
    神经网络;其中,所述训练图像中标注有行人信息。

    根据本发明的第二方面,提供了一种行人检测的装置,包括:

    接收???,用于接收待检测图片;

    确定???,用于采用神经网络,确定所述待检测图片中的行人信息,所述行人信息
    包括行人的位置以及所述行人的关键点位置;

    后处理???,用于对所述待检测图片中的所述行人信息进行后处理,得到所述行
    人检测的结果。

    示例性地,所述行人的关键点位置包括以下中的至少一项:头部位置、左肩位置、
    右肩位置、左膝位置、右膝位置、左脚位置、右脚位置。

    示例性地,所述后处理???,包括:

    过滤子???,用于对所述待检测图片中的所述行人信息进行过滤,得到所述行人
    信息中的高概率行人信息;

    处理子???,用于对所述高概率行人信息进行处理,得到所述行人检测的结果,

    其中,所述高概率行人信息为概率值大于或等于概率阈值的行人信息,所述概率
    阈值为预设概率值。

    示例性地,所述处理子???,用于:根据所述高概率行人信息中的所述行人的关键
    点位置,得到所述行人检测的结果。

    示例性地,所述处理子???,用于:根据所述高概率行人信息中的相邻的两个所述
    行人信息中所述关键点的空间位置与距离确定所述相邻的两个所述行人信息是否属于同
    一行人,以得到所述行人检测的结果。

    示例性地,所述处理子???,用于:根据所述高概率行人信息中的相邻的两个所述
    行人信息中所述关键点的空间位置与距离确定所述相邻的两个所述行人信息是否属于同
    一行人,若所述相邻的两个所述行人信息属于同一行人,则利用非最大抑制方法,对所述相
    邻的两个所述行人信息进行合并操作,得到所述行人检测的结果。

    示例性地,还包括训练???,用于:基于至少一张训练图像,通过训练得到所述神
    经网络;其中,所述训练图像中标注有行人信息。

    第二方面所述的该装置能够用于实现前述第一方面的行人检测的方法。

    根据本发明的第三方面,提供了一种计算机芯片,该计算机芯片包括处理器和存
    储器。所述存储器存储有指令代码,所述处理器用于执行所述指令代码,且当所述处理器执
    行指令代码时,能够实现前述第一方面所述的行人检测的方法。

    由此可见,本发明实施例对于待检测图片,可以采用神经网络,得到行人位置和行
    人的关键点信息,这样通过引入行人的关键点信息,解决了传统行人检测方法中难以解决
    的遮挡和重叠问题,提升了检测的精确度。

    附图说明

    通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其它目的、
    特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明
    书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,
    相同的参考标号通常代表相同部件或步骤。

    图1是本发明实施例的电子设备的一个示意性框图;

    图2是本发明实施例的行人检测的方法的一个示意性流程图;

    图3是本发明实施例的行人检测的装置的一个示意性框图;

    图4是本发明实施例的行人检测的装置的另一个示意性框图。

    具体实施方式

    为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根
    据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发
    明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制?;诒痉⒚髦忻枋龅?br />本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例
    都应落入本发明的?;し段е?。

    本发明实施例可以应用于电子设备,图1所示为本发明实施例的电子设备的一个
    示意性框图。图1所示的电子设备10包括一个或多个处理器102、一个或多个存储装置104、
    输入装置106、输出装置108、图像传感器110以及一个或多个非图像传感器114,这些组件通
    过总线系统112和/或其它形式互连。应当注意,图1所示的电子设备10的组件和结构只是示
    例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。

    所述处理器102可以包括CPU 1021和GPU 1022或者具有数据处理能力和/或指令
    执行能力的其它形式的处理单元,例如现场可编程门阵列(Field-Programmable Gate
    Array,FPGA)或进阶精简指令集机器(Advanced RISC(Reduced Instruction Set
    Computer)Machine,ARM)等,并且处理器102可以控制所述电子设备10中的其它组件以执行
    期望的功能。

    所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可
    以包括各种形式的计算机可读存储介质,例如易失性存储器1041和/或非易失性存储器
    1042。所述易失性存储器1041例如可以包括随机存取存储器(Random Access Memory,RAM)
    和/或高速缓冲存储器(cache)等。所述非易失性存储器1042例如可以包括只读存储器
    (Read-Only Memory,ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多
    个计算机程序指令,处理器102可以运行所述程序指令,以实现各种期望的功能。在所述计
    算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或
    产生的各种数据等。

    所述输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦
    克风和触摸屏等中的一个或多个。

    所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音),并且
    可以包括显示器、扬声器等中的一个或多个。

    所述图像传感器110可以拍摄用户期望的图像(例如照片、视频等),并且将所拍摄
    的图像存储在所述存储装置104中以供其它组件使用。

    当注意,图1所示的电子设备10的组件和结构只是示例性的,尽管图1示出的电子
    设备10包括多个不同的装置,但是根据需要,其中的一些装置可以不是必须的,其中的一些
    装置的数量可以更多等等,本发明对此不限定。

    图2是本发明实施例的行人检测的方法的一个示意性流程图。图2所示的方法包
    括:

    S101,接收待检测图片。

    作为一例,该待检测图片可以是实时采集的图片,具体地可以是由图像采集装置
    实时采集的图片。例如可以是由摄像头采集的视频中的一帧图像或多帧图像,或者,可以是
    由照相机拍摄到的一张图片。作为另一例,该待检测图片可以是从特定的源获取的,例如可
    以从存储器中获取先前采集并存储的图片。本发明对此不限定。

    S102,采用神经网络,确定所述待检测图片中的行人信息,所述行人信息包括行人
    的位置以及所述行人的关键点位置。

    示例性地,行人的关键点位置包括以下中的至少一项:头部位置、两肩位置、两膝
    位置、两脚位置。

    示例性地,所述行人的关键点位置包括以下中的至少一项:头部位置、左肩位置、
    右肩位置、左膝位置、右膝位置、左脚位置、右脚位置。

    具体地,在S102中,可以将待检测图片输入到神经网络中,经由该神经网络得到行
    人信息。

    与传统的神经网络不同,本发明实施例中的神经网络不仅能够得到行人位置,并
    且能够得到行人的关键点位置。另外,S102所得到的行人信息中,不仅包括该待检测图片的
    身体各个部位显示完整的行人的行人信息,还包括身体部分区域被遮挡的行人的行人信
    息。

    举例来说,如果该待检测图片中包括行人A,由于被遮挡,该行人A只有部分身体可
    见。那么在S102中,基于该神经网络,可以根据行人A可见的身体部分推测其他的身体部分。
    例如,如果行人A的头部、左肩、左腿可见,那么基于该神经网络不仅可以直接得到该行人A
    的头部位置、左肩位置、左膝位置和左脚位置,并且能够推测出该行人A的右肩位置、右膝位
    置和右脚位置。从而得到了行人A的关键点信息:头部位置、两肩位置、两膝位置和两脚位
    置。

    作为一例,可以基于所得到的行人的关键点信息确定该行人所在的矩形区域,作
    为行人位置。作为另一例,可以采用神经网络提取该待检测图片的特征张量,并基于该特征
    张量确定行人所在的矩形区域,作为行人位置。本发明对此不限定。

    由此可见,本实施例中,基于神经网络,能够得到被遮挡的行人的行人信息,从而
    能够避免信息丢失,保证处理的精度。

    S103,对所述待检测图片中的所述行人信息进行后处理,得到所述行人检测的结
    果。

    可选地,行人信息可以包括低概率行人信息和高概率行人信息。通过神经网络对
    接收到的图像进行识别,获取图像中的行人信息,对获取到的行人信息进行概率算法运算,
    获得行人信息的概率值,将获得的行人信息的概率值与概率阈值进行比对,若行人信息的
    概率值大于或等于概率阈值,则判断为高概率行人信息;若行人信息的概率值小于概率阈
    值,则判断为低概率行人信息。其中,概率阈值可以为预先设定的概率值,可依据使用场景
    进行设定。

    示例性地,S103可以包括:对所述待检测图片中的所述行人信息进行过滤,得到所
    述行人信息中的所述高概率行人信息;对所述高概率行人信息进行处理,得到所述行人检
    测的结果。其中,所述高概率行人信息为概率值大于或等于概率阈值的行人信息。

    也就是说,可以过滤掉行人信息中的低概率行人信息,只包括高概率行人信息;并
    进一步基于高概率行人信息得到行人检测的结果。

    示例性地,所述对所述过滤之后的所述行人信息进行处理,得到所述行人检测的
    结果,包括:根据所述高概率行人信息中的相邻的两个所述行人信息中所述关键点的空间
    位置与距离确定所述相邻的两个所述行人信息是否属于同一行人,以得到所述行人检测的
    结果。

    也就是说,可以利用高概率行人信息中的关键点位置进行判断处理,从而得到行
    人检测的结果。其中,关键点信息包括但不限于目标头部距离,目标肩部重合度等??裳〉?,
    可在上述处理过程中辅助实施非最大抑制(Non-Maximum Suppression,NMS),根据所述高
    概率行人信息中的相邻的两个所述行人信息中所述关键点的空间位置与距离确定所述相
    邻的两个所述行人信息是否属于同一行人,若所述相邻的两个所述行人信息属于同一行
    人,则利用非最大抑制方法,对所述相邻的两个所述行人信息进行合并操作,得到所述行人
    检测的结果,从而进一步提升检测结果的精度。

    利用高概率行人信息中的关键点位置进行判断处理得到行人检测的结果,可采用
    如下方式之一进行。

    方式一:基于人体部位特征对高概率行人信息中的关键点进行分类,例如,将行人
    信息关键点中属于行人头部的关键点分类识别为头部关键点,将属于行人左肩的关键点分
    类识别为左肩关键点;分析相邻的同属于一类的关键点之间的空间位置与距离,以区分遮
    挡和/或重叠的行人,例如,相邻两个头部关键点之间的距离大于预设值,则判断这两个头
    部关键点属于两个人,相邻的两个左肩关键点之间的距离小于预设值,则判断这两个左肩
    关键点属于一个人。由于一个行人拥有多个关键点,通过判断每一个关键点与相邻的同类
    关键点之间的空间位置与距离,避免了传统行人检测仅检测行人整体产生的遮挡和重叠问
    题,提升了检测的精度;

    方式二:基于人体部位特征对高概率行人信息中的关键点进行分类,例如,将行人
    信息关键点中属于行人头部的关键点分类识别为头部关键点,将属于行人左肩的关键点分
    类识别为左肩关键点;分析相邻行人信息中的关键点之间的空间位置与距离,以区分遮挡
    和/或重叠的行人,例如,相邻的行人信息为行人信息A和行人信息B,判断行人信息A中的左
    肩关键点与行人信息B中的头部关键点和/或右肩关键点和/或左膝关键点和/或左脚关键
    点等关键点之间的空间位置与距离,当行人信息A中的左肩关键点与行人信息B中的头部关
    键点和/或右肩关键点、和/或左膝关键点、和/或左脚关键点等关键点之间的空间位置与距
    离符合预设条件时,则判断行人信息A和行人信息B属于同一行人,其中,预设条件包括预设
    距离和/或预设相对位置等。

    由此可见,在S103的后处理过程中,可以综合神经网络检测或推测的所有行人信
    息,移除低置信度的行人信息而保留高置信度的行人信息,这样能够保证该处理过程的精
    度。

    示例性地,本发明实施例中所采用的神经网络可以是在图2所述的方法之前,通过
    训练的方法所得到的。

    具体地,在图2所示的方法之前,可以包括:基于至少一张训练图像,通过训练得到
    所述神经网络。其中,所述训练图像中标注有行人信息。所述行人信息包括行人的位置以及
    所述行人的关键点位置。

    可选地,在图2所示的方法之前,可以包括:获取至少一张训练图像;对所述训练图
    像进行标注;基于所述标注的训练图像,通过训练得到所述神经网络。

    其中,对所述训练图像进行标注包括:对每一张训练图像中的每一个行人样本,标
    注该行人样本的位置,并标注该行人样本的头部位置、两肩位置、两膝位置和两脚位置。其
    中,如果行人样本的某个或某几个部位被遮挡时,对该某个或某几个部位标记为遮挡???br />见,标注信息不仅包括行人位置、头部位置、两肩位置、两膝位置和两脚位置,还包括是否被
    遮挡的信息。示例性的,将行人B的关键点信息在图片中进行标注,假设图片中行人B的头部
    位置、左肩位置、左膝位置和左脚位置未被遮挡,右肩位置、右膝位置和右脚位置被其他行
    人或物体遮挡,则可在行人B的头部位置、左肩位置、左膝位置和左脚位置分别标记为“头
    部”、“左肩”、“左膝”、“左脚”;在被遮挡的行人B的右肩位置、右膝位置和右脚位置分别标记
    为“右肩(遮挡)”、“右膝(遮挡)”、“右脚(遮挡)”,或在被遮挡的行人B的右肩位置、右膝位置
    和右脚位置统一标记为“遮挡”。

    进一步地,所训练的神经网络不仅要学会如何检测或推测行人位置(即行人整体
    的位置),还应学会如何检测或推测每个行人的关键点位置。

    由此可见,本发明实施例对于待检测图片,可以采用神经网络,得到行人位置和行
    人的关键点信息,通过引入行人的关键点信息,解决了传统行人检测方法中难以解决的遮
    挡和重叠问题,提升了检测的精确度。另外,可理解,行人的关键点信息还可以用于人体姿
    态分析等其他的领域,本发明对此不限定。

    图3是本发明实施例的行人检测的装置的一个示意性框图。图3所示的装置30包
    括:接收???01、确定???02和后处理???03。

    接收???01,用于接收待检测图片;

    确定???02,用于采用神经网络,确定接收???01接收的所述待检测图片中的
    行人信息,所述行人信息包括行人的位置以及所述行人的关键点位置;

    后处理???03,用于对确定???02确定的所述待检测图片中的所述行人信息进
    行后处理,得到所述行人检测的结果。

    示例性地,所述行人的关键点位置包括以下中的至少一项:头部位置、左肩位置、
    右肩位置、左膝位置、右膝位置、左脚位置、右脚位置。

    示例性地,后处理???03,包括过滤子??楹痛碜幽??。

    过滤子??榭梢杂糜诙运龃觳馔计械乃鲂腥诵畔⒔泄?,得到所述行
    人信息中的高概率行人信息。处理子??榭梢杂糜诙运龈吒怕市腥诵畔⒔写?,得到
    所述行人检测的结果。其中,所述高概率行人信息为概率值大于或等于概率阈值的行人信
    息,所述概率阈值为预设概率值。

    示例性地,所述处理子??榭梢杂糜冢焊菟龈吒怕市腥诵畔⒅械乃鲂腥说?br />关键点位置,得到所述行人检测的结果。

    示例性地,所述处理子??榭梢跃咛逵糜冢焊菟龈吒怕市腥诵畔⒅械南嗔诘?br />两个所述行人信息中所述关键点的空间位置与距离确定所述相邻的两个所述行人信息是
    否属于同一行人,以得到所述行人检测的结果。

    示例性地,所述处理子??榭梢跃咛逵糜冢焊菟龈吒怕市腥诵畔⒅械南嗔诘?br />两个所述行人信息中所述关键点的空间位置与距离确定所述相邻的两个所述行人信息是
    否属于同一行人,若所述相邻的两个所述行人信息属于同一行人,则利用非最大抑制方法,
    对所述相邻的两个所述行人信息进行合并操作,得到所述行人检测的结果。

    处理子??槔酶吒怕市腥诵畔⒅械墓丶阄恢媒信卸洗淼玫叫腥思觳獾?br />结果,可采用如下方式之一进行。

    方式一:处理子??榛谌颂宀课惶卣鞫愿吒怕市腥诵畔⒅械墓丶憬蟹掷?,
    例如,将行人信息关键点中属于行人头部的关键点分类识别为头部关键点,将属于行人左
    肩的关键点分类识别为左肩关键点;分析相邻的同属于一类的关键点之间的空间位置与距
    离,以区分遮挡和/或重叠的行人,例如,相邻两个头部关键点之间的距离大于预设值,则判
    断这两个头部关键点属于两个人,相邻的两个左肩关键点之间的距离小于预设值,则判断
    这两个左肩关键点属于一个人。由于一个行人拥有多个关键点,通过判断每一个关键点与
    相邻的同类关键点之间的空间位置与距离,避免了传统行人检测仅检测行人整体产生的遮
    挡和重叠问题,提升了检测的精度;

    方式二:处理子??榛谌颂宀课惶卣鞫愿吒怕市腥诵畔⒅械墓丶憬蟹掷?,
    例如,将行人信息关键点中属于行人头部的关键点分类识别为头部关键点,将属于行人左
    肩的关键点分类识别为左肩关键点;分析相邻行人信息中的关键点之间的空间位置与距
    离,以区分遮挡和/或重叠的行人,例如,相邻的行人信息为行人信息A和行人信息B,判断行
    人信息A中的左肩关键点与行人信息B中的头部关键点和/或右肩关键点和/或左膝关键点
    和/或左脚关键点等关键点之间的空间位置与距离,当行人信息A中的左肩关键点与行人信
    息B中的头部关键点和/或右肩关键点和/或左膝关键点和/或左脚关键点等关键点之间的
    空间位置与距离符合预设条件时,则判断行人信息A和行人信息B属于同一行人,其中,预设
    条件包括预设距离和/或预设相对位置等。

    由此可见,处理子??榭梢宰酆仙窬缂觳饣蛲撇獾乃行腥诵畔?,移除低置
    信度的行人信息而保留高置信度的行人信息,这样能够保证该处理过程的精度。

    示例性地,如图4所示,装置30还包括训练???04。训练???04可以用于:基于至
    少一张训练图像,通过训练得到所述神经网络。其中,所述训练图像中标注有行人信息。所
    标注的行人信息可以包括行人的位置以及所述行人的关键点位置。

    图3或图4所示的装置30能够用于实现前述图2所示的行人检测的方法。

    另外,本发明实施例还提供了另一种行人检测的装置,该装置可以包括处理器和
    存储器,其中,存储器用于存储指令代码,处理器执行该指令代码时,可以实现前述图2所示
    的行人检测的方法。

    另外,本发明实施例还提供了另一种行人检测的装置,该装置可以包括处理器,其
    中,处理器能够同时实现图3中确定???02和后处理???03的功能,从而实现前述图2所
    示的行人检测的方法。

    另外,本发明实施例还提供了一种电子设备,该电子设备可以包括图3或图4所示
    的装置30。该电子设备可以实现前述图2所示的行人检测的方法。

    由此可见,本发明实施例对于待检测图片,可以采用神经网络,得到行人位置和行
    人的关键点信息,通过引入行人的关键点信息,解决了传统行人检测方法中难以解决的遮
    挡和重叠问题,提升了检测的精确度。也就是说本发明实施例的方法在行人检测过程中能
    够保证高精度和准确度。另外,可理解,行人的关键点信息还可以用于人体姿态分析等其他
    的领域,本发明对此不限定。

    尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性
    的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变
    和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求
    所要求的本发明的范围之内。

    本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单
    元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟
    以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员
    可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出
    本发明的范围。

    在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其
    它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅
    仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结
    合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。

    在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施
    例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构
    和技术,以便不模糊对本说明书的理解。

    类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在
    对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、
    或者对其的描述中。然而,并不应将该本发明的方法解释成反映如下意图:即所要求?;さ?br />本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权
    利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特
    征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体
    实施方式,其中每个权利要求本身都作为本发明的单独实施例。

    本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对
    本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法
    或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要
    求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

    此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例
    中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的
    范围之内并且形成不同的实施例。例如,在权利要求书中,所要求?;さ氖凳├娜我庵?br />都可以以任意的组合方式来使用。

    本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行
    的软件??槭迪?,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用
    微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的物品分析设备中的一些模
    块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全
    部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储
    在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网
    网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

    应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领
    域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,
    不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未
    列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的
    元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实
    现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项
    来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序??山庑┑ゴ式馐臀?br />称。

    以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的?;?br />范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易
    想到变化或替换,都应涵盖在本发明的?;し段е?。本发明的?;し段вσ匀ɡ蟮?br />?;し段?。

    关于本文
    本文标题:行人检测的方法及装置.pdf
    链接地址://www.4mum.com.cn/p-6001575.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 大乐透30期走势图 双色球最新500期走 腾讯分分彩后三不定胆计划 研究3d跨度技巧规律 后三组六稳赚方法包号 11选5技巧稳赚任三 71豆幸运28挂机稳赚 3d技巧规律乘以3.14 北京pk赛车计划最准 3期计划防止连挂倍投法 大乐透2019新规则 网上说带人玩五分彩稳赚是不是真的 体彩11选5每期稳赚一元 竞彩足球全包法 购彩计划软件下载 pk10千里马计划app