• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 9
    • 下载费用:30 金币  

    怎么下载重庆时时彩: 一种基于人体表观结构的人群数量预测方法.pdf

    关 键 词:
    一种 基于 人体 表观 结构 人群 数量 预测 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201611225785.8

    申请日:

    2016.12.27

    公开号:

    CN106815563A

    公开日:

    2017.06.09

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G06K 9/00申请日:20161227|||公开
    IPC分类号: G06K9/00; G06K9/62; G06K9/34; G06N3/08 主分类号: G06K9/00
    申请人: 浙江大学
    发明人: 黄思羽; 张仲非; 李玺
    地址: 310027 浙江省杭州市西湖区浙大路38号
    优先权:
    专利代理机构: 杭州宇信知识产权代理事务所(普通合伙) 33231 代理人: 李琳
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201611225785.8

    授权公告号:

    |||

    法律状态公告日:

    2017.07.04|||2017.06.09

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明公开了一种基于人体表观结构的人群数量预测方法,用于预测给定场景图像里的人群数量。具体包括如下步骤:获取用于训练人群数量预测模型的监控图像数据集,并定义算法目标;对监控图像数据集中行人身体的表观语义结构进行建模,并对行人的密度分布和身体形状进行联合建模;根据步骤S2中的建模结果建立人群数量的预测模型;使用所述预测模型预测场景图像中的人群数量。本发明适用于真实视频监控场景中的人群数量预测,面对各类复杂情况具有较佳的效果和鲁棒性。

    权利要求书

    1.一种基于人体表观结构的人群数量预测方法,其特征在于,包括以下步骤:
    S1、获取用于训练人群数量预测模型的监控图像数据集,并定义算法目标;
    S2、对监控图像数据集中行人身体的表观语义结构进行建模,并对行人的密度分布和
    身体形状进行联合建模;
    S3、根据步骤S2中的建模结果建立人群数量的预测模型;
    S4、使用所述预测模型预测场景图像中的人群数量。
    2.如权利要求1所述的基于人体表观结构的人群数量预测方法,其特征在于,步骤S1
    中,所述的用于训练人群数量预测模型的监控图像数据集,包括场景图像人工标注
    的行人头部位置Ptrain和场景深度图
    定义算法目标为:预测一幅场景图像中的行人数量C。
    3.如权利要求2所述的基于人体表观结构的人群数量预测方法,其特征在于,步骤S2
    中,对行人身体的表观语义结构进行建模具体包括:
    S21、根据监控图像数据集中所有行人头部位置Ptrain及其各自的场景深度值
    确定每个行人图像边界框的位置和大小,以此从场景图像集中裁
    剪得行人图像Itrain;
    S22、将行人图像Itrain分别输入单个行人语义分割系统进行语义分割;
    S23、对每幅场景图像将其中所有行人的分割结果按原尺寸和位置还原,得到场景图
    像的人群语义结构图反映场景图像中所有行人的身体部分的语义结构信息。
    4.如权利要求3所述的基于人体表观结构的人群数量预测方法,其特征在于,步骤S2
    中,对行人的密度分布和身体形状进行联合建模具体包括:
    S24、对场景图像中的行人的密度分布和身体形状进行联合建模,得到结构化人群密
    度图

    其中,p是上的像素位置,是二维高斯核用以近似人头的形状,是二维高斯核
    用以近似人身体的形状,和分别是第i个人头和人身体的中心位置,取自Ptrain,
    由和场景深度值估算得出,σh和σb分别是和的方差,分别由和
    估算得到,由人群语义结构图二值化得到,C是场景中的行人数量,Z是归一化
    系数使每一个行人在上的密度和为1,结构化人群密度图反映场景图像中所有行人
    的密度分布和身体形状信息。
    5.如权利要求4所述的基于人体表观结构的人群数量预测方法,其特征在于,步骤S3
    中,建立人群数量的预测模型具体包括:
    S31、建立深度卷积神经网络,神经网络的输入为一幅场景图像输出为对应的人群
    语义结构图结构化人群密度图以及中的行人数量从而,神经网络的结构可以表
    示为映射
    S32、子映射使用软最大(Softmax)损失函数,表示为

    其中是神经网络的输出之一,表示中像素位置(h,w)和通道i的值,由
    步骤S23所述方法生成,表示中像素位置(h,w)的值;
    S33、子映射使用欧几里得损失函数,表示为

    其中是神经网络的输出之一,由步骤S24所述方法生成;
    S34、子映射使用欧几里得损失函数,表示为

    其中是神经网络的输出之一,C是人工标注的人群数量;
    S35、整个神经网络的损失函数为
    L=Lc+λdLd+λbLb 公式(5)
    使用随机梯度下降和反向传播算法在损失函数L下训练整个神经网络。
    6.如权利要求5所述的基于人体表观结构的人群数量预测方法,其特征在于,步骤S4
    中,预测场景图像中的人群数量包括:将待预测的场景图像输入训练好的神经网络,其输
    出的人群数量C即为人群数量预测的结果。

    说明书

    一种基于人体表观结构的人群数量预测方法

    技术领域

    本发明属于计算机视觉领域,特别地涉及一种基于人体表观结构的人群数量预测
    方法。

    背景技术

    20世纪末以来,随着计算机视觉的发展,智能视频监控技术得到广泛的关注和研
    究。人群计数是其中一项重要和具有挑战性的任务,其目标是准确预测高密度人群图像中
    的行人数量。人群计数任务的的三个关键因素是行人、头部以及它们的上下文结构。当我们
    人类在统计人群的数量时,我们会利用行人身体不同部分的语义结构作为线索来准确判断
    每个人的位置。因此,准确地预测人群数量需要对行人身体的语义结构进行分析。

    现有的人群计数方法通常包含如下三类:1、基于行人检测器的人群计数。这类方
    法利用各种行人检测器来匹配图像中的每个行人;2、基于全局回归的人群计数。这类方法
    主要建模人群图像与人群数量之间的映射;3、基于密度估计的人群计数。这类方法建模人
    群的密度分布,再通过密度分布预测人群数量。现有的方法将行人的整个身体作为一个整
    体建模,或者仅建模行人的头部。它们忽略了丰富的行人身体部分的语义结构信息,利用这
    些结构信息可以提高人群计数算法的性能。

    发明内容

    为解决上述问题,本发明的目的在于提供一种基于人体表观结构的人群数量预测
    方法,用于预测给定场景图像里的人群数量。本方法基于深度神经网络对行人的身体表观
    结构和密度分布信息进行语义建模,并根据建模结果预测准确的人群数量,能够更好地适
    应真实视频监控场景中的复杂情况。

    为实现上述目的,本发明的技术方案为:

    一种基于人体表观结构的人群数量预测方法,包括以下步骤:

    S1、获取用于训练人群数量预测模型的监控图像数据集,并定义算法目标;

    S2、对监控图像数据集中行人身体的表观语义结构进行建模,并对行人的密度分
    布和身体形状进行联合建模;

    S3、根据步骤S2中的建模结果建立人群数量的预测模型;

    S4、使用所述预测模型预测场景图像中的人群数量。

    进一步的,步骤S1中,所述的用于训练人群数量预测模型的监控图像数据集,包括
    场景图像人工标注的行人头部位置Ptrain和场景深度图

    定义算法目标为:预测一幅场景图像中的行人数量

    进一步的,步骤S2中,对行人身体的表观语义结构进行建模具体包括:

    S21、根据监控图像数据集中所有行人头部位置Ptrain及其各自的场景深度值
    确定每个行人图像边界框的位置和大小,以此从场景图像集中裁
    剪得行人图像Itrain;

    S22、将行人图像Itrain分别输入单个行人语义分割系统进行语义分割;

    S23、对每幅场景图像将其中所有行人的分割结果按原尺寸和位置还原,得到
    场景图像的人群语义结构图反映场景图像中所有行人的身体部分的语义结构信
    息。

    进一步的,步骤S2中,对行人的密度分布和身体形状的联合建模具体包括:

    S24、对场景图像中的行人的密度分布和身体形状进行联合建模,得到结构化人
    群密度图


    其中,p是上的像素位置,是二维高斯核用以近似人头的形状,是二维高
    斯核用以近似人身体的形状,和分别是第i个人头和人身体的中心位置,取自
    Ptrain,由和场景深度值估算得出,σh和σb分别是和的方差,它们分别由
    和估算得到,由人群语义结构图二值化得到,是场景中的行人数
    量,Z是归一化系数使每一个行人在上的密度和为1,结构化人群密度图反映场景图像
    中所有行人的密度分布和身体形状信息。

    进一步的,步骤S3中,建立人群数量的预测模型具体包括:

    S31、建立深度卷积神经网络,神经网络的输入为一幅场景图像输出为对应
    的人群语义结构图结构化人群密度图以及中的行人数量从而,神经网络的结构
    可以表示为映射

    S32、子映射使用软最大(Softmax)损失函数,表示为


    其中是神经网络的输出之一,表示中像素位置(h,w)和通道i的值,
    由步骤S23所述方法生成,表示中像素位置(h,w)的值;

    S33、子映射使用欧几里得损失函数,表示为


    其中是神经网络的输出之一,由步骤S24所述方法生成;

    S34、子映射使用欧几里得损失函数,表示为


    其中是神经网络的输出之一,是人工标注的人群数量;

    S35、整个神经网络的损失函数为

    L=Lc+λdLd+λbLb 公式(5)

    使用随机梯度下降和反向传播算法在损失函数L下训练整个神经网络。

    进一步的,步骤S4中,预测场景图像中的人群数量包括:将待预测的场景图像输
    入训练好的神经网络,其输出的人群数量即为人群数量预测的结果。

    本发明的基于人体表观结构的人群数量预测方法,相比于现有的人群数量预测方
    法,具有以下有益效果:

    首先,本发明的人群数量预测方法发掘了人群计数问题的语义属性,定义并建模
    了本问题的三个关键因素:身体,头部和它们的上下文结构。该种假设更加适应实际场景中
    的复杂情况。

    其次,本发明的人群数量预测方法基于深度卷积神经网络建立人群数量预测模
    型。深度卷积神经网络能够更好地表达视觉特征,另外,视觉特征提取、行人语义建模和人
    群数量回归被统一在同一个框架里,提高了方法的最终效果。

    本发明的基于人体表观结构的人群数量预测方法,在智能视频监控分析系统里具
    有良好的应用价值,能够有效提高人群数量预测的效率和准确度。例如,在公共安全的应用
    场景里,本发明的人群数量预测方法可以快速和准确地预测监控摄像头拍摄区域的行人数
    量,为公共场所的日常运行和应急处理提供决策依据。

    附图说明

    图1为本发明的基于人体表观结构的人群数量预测方法的流程示意图。

    具体实施方式

    为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对
    本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并
    不用于限定本发明。

    相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修
    改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细
    节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的
    描述也可以完全理解本发明。

    参考图1,在本发明的较佳实施例中,基于人体表观结构的人群数量预测方法,包
    括以下步骤:

    首先,获取用于训练人群数量预测模型的监控图像数据集。其中,用于训练人群数
    量预测模型的监控图像数据集,包括场景图像人工标注的行人头部位置Ptrain和场
    景深度图

    定义算法目标为:预测一幅场景图像中的行人数量

    其次,对获得的监控图像数据集中行人的密度分布和身体形状进行联合建模。具
    体的,其包括如下步骤:

    第一步,根据监控图像数据集中所有行人头部位置Ptrain及其各自的场景深度值
    确定每个行人图像边界框的位置和大小,以此从场景图像集中裁
    剪得行人图像Itrain;

    第二步,将行人图像Itrain分别输入单个行人语义分割系统进行语义分割;

    第三步,对每幅场景图像将其中所有行人的分割结果按原尺寸和位置还原,得
    到场景图像的人群语义结构图反映场景图像中所有行人的身体部分的语义结构
    信息。

    接下来,对行人的密度分布和身体形状进行联合建模。对场景图像中的行人的
    密度分布和身体形状进行联合建模,得到结构化人群密度图


    其中,p是上的像素位置,是二维高斯核用以近似人头的形状,是二维高
    斯核用以近似人身体的形状。和分别是第i个人头和人身体的中心位置,取自
    Ptrain,由和场景深度值估算得出。σh和σb分别是和的方差,它们分别由
    和估算得到。由人群语义结构图二值化得到。是场景中的行人数
    量,Z是归一化系数使每一个行人在上的密度和为1。结构化人群密度图反映场景图像
    中所有行人的密度分布和身体形状信息。

    之后,建立人群数量的预测模型。具体包括:

    第一步,建立深度卷积神经网络,神经网络的输入为一幅场景图像输出为对应
    的人群语义结构图结构化人群密度图以及中的行人数量从而,神经网络的结
    构可以表示为映射

    第二步,子映射使用软最大(Softmax)损失函数,表示为


    其中是神经网络的输出之一,表示中像素位置(h,w)和通道i的值,
    表示中像素位置(h,w)的值;

    第三步,子映射使用欧几里得损失函数,表示为


    其中是神经网络的输出之一,由公式(1)所述方法生成。

    第四步,子映射使用欧几里得损失函数,表示为


    其中是神经网络的输出之一,是人工标注的人群数量。

    第五步,整个神经网络的损失函数为

    L=Lc+λdLd+λbLb 公式(5)

    使用随机梯度下降和反向传播算法在损失函数L下训练整个神经网络。

    最后,使用建立的模型对待预测场景图像中的人群数量进行预测。具体包括:将预
    测的场景图像输入训练好的神经网络,其输出的人群数量即为人群数量预测的结果。

    上述实施例中,本发明的人群数量预测方法首先将行人的身体表观结构和密度分
    布信息建模为两种语义场景模型。在此基础上,将原问题转化为多任务学习问题,并基于深
    度神经网络建立人群数量预测模型。最后,利用训练好的人群数量预测模型来预测新的场
    景图像中准确的行人数量。

    通过以上技术方案,本发明实施例基于深度学习技术发展了一种应用于视频监控
    场景的人群数量预测算法。本发明可以同时有效建模行人的身体语义结构信息和密度分布
    信息,从而预测准确的人群数量。

    以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精
    神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的?;し段е?。

    关于本文
    本文标题:一种基于人体表观结构的人群数量预测方法.pdf
    链接地址://www.4mum.com.cn/p-6021171.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 北京时时11选5开奖 幸运飞艇必中计划软件手机 大乐透专家预测最精确 重庆市时时彩计划软件下载 分分6合精准计划软件 大小单双玩法 新疆时时96期开奖记录 福彩3d位选投注金额表 概况 幸运赛车10号稳赚技巧 北京pk10手机版走势图 技巧规律 多赢幸运飞艇全能计划 秒速时时官方金祥 七乐彩开奖直播现场 全网无错最早35码