• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 11
    • 下载费用:30 金币  

    重庆时时彩组三组六判断: 基于图像哈希的大规模图像库检索方法.pdf

    关 键 词:
    基于 图像 大规模 检索 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN200910220599.9

    申请日:

    2009.12.04

    公开号:

    CN101710334A

    公开日:

    2010.05.19

    当前法律状态:

    终止

    有效性:

    无权

    法律详情: 未缴年费专利权终止IPC(主分类):G06F 17/30申请日:20091204授权公告日:20120125终止日期:20151204|||授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20091204|||公开
    IPC分类号: G06F17/30; G06K9/62 主分类号: G06F17/30
    申请人: 大连理工大学
    发明人: 孔祥维; 付海燕; 杨德礼; 郭艳卿
    地址: 116024 辽宁省大连市甘井子区凌工路2号
    优先权:
    专利代理机构: 大连理工大学专利中心 21200 代理人: 侯明远
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN200910220599.9

    授权公告号:

    |||101710334B||||||

    法律状态公告日:

    2017.01.18|||2012.01.25|||2010.07.07|||2010.05.19

    法律状态类型:

    专利权的终止|||授权|||实质审查的生效|||公开

    摘要

    一种基于图像哈希的大规模图像库检索方法,属于图像检索技术领域,涉及基于内容的图像检索方法。其特征是从待检索的图像库中选取与查询图像相关的训练图像;分别提取待检索图像、训练图像和查询图像的Gist特征。利用K均值聚类法将训练特征聚成C类;对每类样本特征,计算其超球面分类函数由此定义哈希函数为计算待检索图像特征和查询图像特征的哈希序列;并计算查询图像哈希序列与待检索图像哈希序列之间的汉明距离;设定阈值d,返回相似的图像。本发明的效果和益处是克服了LSH方法哈希函数数量多的问题;解决了谱哈希法和语义哈希法不能扩展到核空间的问题,同时也完善了KLSH方法计算哈希函数时对样本的选择问题。

    权利要求书

    1: 一种基于图像哈希的大规模图像库检索方法,其特征在于包括如下步骤: 1)建立图像库I={I 1 ,I 2 ,...,I N },其中包含N幅图像;从图像库中挑选M幅(M<N)包含同一对象的图像,组成训练库T={T 1 ,T 2 ,...,T M }; 2)对于图像库I和训练库T中的每一幅图像,利用Gist描述符提取图像的纹理特征,每一幅图像用一个高维特征向量表示;图像库对应的所有特征向量组成图像特征库GI={GI 1 ,GI 2 ,...,GI N },特征库中的每个特征向量GI i ,(1≤i≤N)和图像库中的每幅图像I i ,(1≤i≤N)一一对应;训练库对应的所有特征向量组成训练特征库GT={GT 1 ,GT 2 ,...,GT M },特征库中的每个特征向量GT i ,(1≤i≤M)和训练库中的每幅图像T i ,(1≤i≤M)一一对应; 3)对于训练特征库中的M个特征向量GT={GT 1 ,GT 2 ,...,GT M },利用K均值聚类将其聚成C类,得到C组聚类样本S={S 1 ,S 2 ,...,S C }; 4)对于每一组聚类样本S i ,(1≤i≤C),定义基于核函数的超球面分类函数: P i ( x ) = Σ i = 1 m i α i K ( x i , x ) ]]> 其中m i 是S i ,(1≤i≤C)中包含的样本数;α i 是m i 维向量,通过训练得到; K(x i ,x)是核函数,选择径向基核函数; 根据已知的训练样本S i ,(1≤i≤C),求解如下方程得到α i : min ( 1 2 | | α i | | 2 ) ]]> 约束条件为 α i ·x i >1,i=1,2,...,m i 从而确定最优超球面分类面,该分类面是能最大限度的包含所有聚类样本的最小分类面; 5)根据已求得的超球面分类函数P(x)={P 1 (x),P 2 (x),...,P C (x)},定义哈希函数H(x)={H 1 (x),H 2 (x),...,H C (x)},其中 H i ( x ) = sign ( P i ( x ) ) = 1 P i ( x ) > = 0 0 else ]]> 对于特征库中的每个特征向量GI i ,(1≤i≤N),利用哈希函数簇H(x)={H 1 (x),H 2 (x),...,H C (x)}生成长度为C的哈希序列HI i ={H 1 I i ,...,H C I i },(1≤i≤N); 6)对于查询图像Q,提取其Gist特征向量GQ后,利用哈希函数H(x)={H 1 (x),H 2 (x),...,H C (x)}构造其对应的哈希序列HQ={H 1 Q,...,H C Q}; 7)对于查询哈希序列HQ={H 1 Q,...,H C Q}和图像特征库的每个哈希序列HI i ={H 1 I i ,...,H C I i },(1≤i≤N),计算它们之间的汉明距离DH i =∑xor(HI i ,HQ),(1≤i≤N),根据距离大小判断图像库中图像与查询图像之间的相似性。

    说明书


    基于图像哈希的大规模图像库检索方法

        【技术领域】

        本发明属于图像检索技术领域,涉及到基于内容的图像检索方法,特别涉及到一种基于图像哈希的大规模图像库检索方法。

        背景技术

        基于内容的图像检索自上世纪九十年代出现以来一直倍受研究者关注,出现了很多优秀的技术和方法,研究热点主要集中于图像特征表示、相似性度量和人工反馈等。

        准确、快速地搜索是衡量基于图像检索方法优劣的两个重要指标。现有检索方法通过提取图像的低层特征对图像内容进行描述,然后利用特征比对判断是否为相似图像。为了提高搜索的准确率,提取的图像特征往往成百上千维,当图像库达到几十万或者海量时,必然需要庞大的存储空间保存图像的特征库。另外,每一次搜索都需要将查询特征与特征库中的所有特征进行比对、排序,极大的降低了搜索速度。

        为了降低特征存储空间,提高搜索速度,有研究提出用哈希序列作为图像特征。这类研究主要解决如何构造低维二值模式,也就是如何生成哈希序列的问题。一个最经典同时应用也比较广泛的算法是locality-sensitive?hashing(LSH)方法,[P.Indyk?and?R.Motwani.Approximate?Nearest?Neighbors:Towards?Removingthe?Curse?of?Dimensionality.In?STOC,1998.]该方法利用随机映射产生二值哈希序列。该技术的优点是,当哈希序列的比特数增加时,随机映射能够保留原始输入数据之间的距离在一个范围内。但其缺点是,为了保留原始输入数据之间的距离趋势,所需的哈希比特往往比较多。

        为了克服LSH的缺点,语义哈希(Semantic?Hashing)方法,[R.R.Salakhutdinovand?G.E.Hinton.Learning?a?Nonlinear?Embedding?by?Preserving?Class?NeighborhoodStructure.In?AISTATS,2007.]和谱哈希(Spectral?Hashing)方法,[Y.?Weiss,A.Torrelba,and?R.Fergus.Spectral?Hashing.In?NIPS,2008]利用机器学习的方法寻找合适的哈希函数,建立哈希构造机制。这两个方法在近似搜索降低哈希比特方面比LSH方法更优秀,其中谱哈希方法证明,只利用32比特哈希值就能以较高的准确率搜索出相关图像。但这两种方法的缺点是,不能被直接应用到核空间,而且根据经验预先假定原始输入数据的分布规律,例如谱哈希方法认为输入数据在欧氏空间中服从均匀分布。这一假定没有任何理论依据。

        为了克服谱哈希和语义哈希方法的缺点,基于核的LSH方法(KernelizedLocal-Sensitive?Hashing,KLSH)方法[Brian?Kulis?and?Trevor?Darrell.Learning?toHash?with?Binary?Reconstructive?Embeddings.In?Neural?Information?ProcessingSystems(NIPS),2009]利用坐标下降法对哈希函数进行学习,将哈希方法扩展到核函数空间。但KLSH随机选择训练样本构造哈希函数,虽然操作简单,但当样本分布不均匀时,随机选择样本会导致核函数加权系数误差偏大。

        【发明内容】

        本发明要解决的技术问题是针对海量图像检索存在的图像特征库存储空间大,检索速度慢的问题,克服LSH,Semantic?Hashing,Spectral?Hashing和KLSH方法存在的不足,提出一种基于图像哈希的大规模图像库检索方法。

        本发明的技术方案是:对于图像库中的图像,采用特征描述符提取特征向量,作为检索特征。通过已知标签的训练样本,利用优化方法求得超球面分类面,并由此构造哈希函数。根据哈希函数,对特征库中的每个特征向量产生一串哈希序列,将特征向量映射到汉明空间中。对于每一幅查询图像,计算其与待检索图像哈希序列之间的汉明距离,利用距离大小衡量待检索图像与查询图像之间的相似性,返回相似度高的图像。具体实现步骤包括:

        (1)建立图像库I={I1,I2,...,IN},其中包含N幅图像。从图像库中挑选M幅(M<N)包含同一对象的图像,组成训练库T={T1,T2,...,TM}。

        (2)对于图像库I和训练库T中的每一幅图像,利用Gist描述符提取图像的纹理特征,每一幅图像用一个高维特征向量表示。图像库对应的所有特征向量组成图像特征库GI={GI1,GI2,...,GIN},特征库中的每个特征向量GIi,(1≤i≤N)和图像库中的每幅图像Ii,(1≤i≤N)一一对应。训练库对应的所有特征向量组成训练特征库GT={GT1,GT2,...,GTM},特征库中的每个特征向量GTi,(1≤i≤M)和训练库中的每幅图像Ti,(1≤i≤M)一一对应。

        (3)对于训练特征库中的M个特征向量GT={GT1,GT2,...,GTM},利用K均值聚类将其聚成C类,得到C组聚类样本S={S1,S2,...,SC}。

        (4)对于每一组聚类样本Si,(1≤i≤C),定义基于核函数的超球面分类函数:

        Pi(x)=Σi=1miαiK(xi,x)]]>

        其中mi是Si,(1≤i≤C)中包含的样本数;αi是mi维向量,通过训练得到;K(xi,x)是核函数,选择径向基核函数。

        根据已知的训练样本Si,(1≤i≤C),求解如下方程得到αi:

        min(12||αi||2)]]>

        约束条件为

        αi·xi>1,i=1,2,...,mi

        从而确定最优超球面分类面,该分类面是能最大限度的包含所有聚类样本的最小分类面。

        (5)根据已求得的超球面分类函数P(x)={P1(x),P2(x),...,PC(x)},定义哈希函数H(x)={H1(x),H2(x),...,HC(x)},其中

        Hi(x)=sign(Pi(x))=1Pi(x)>=00else]]>

        对于特征库中的每个特征向量GIi,(1≤i≤N),利用哈希函数簇H(x)={H1(x),H2(x),...,HC(x)}生成长度为C的哈希序列HIi={H1Ii,...,HCIi},(1≤i≤N)。

        (6)对于查询图像Q,提取其Gist特征向量GQ后,利用哈希函数H(x)={H1(x),H2(x),...,HC(x)}构造其对应的哈希序列HQ={H1Q,...,HCQ}。

        (7)对于查询哈希序列HQ={H1Q,...,HCQ}和图像特征库的每个哈希序列HIi={H1Ii,...,HCIi},(1≤i≤N),计算它们之间的汉明距离DHi=∑xor(HIi,HQ),(1≤i≤N),根据距离大小判断图像库中图像与查询图像之间的相似性。

        关于Gist特征向量的提取可参考文献[Aude?Oliva,Antonio?Torralba,Modeling?the?shape?of?the?scene:a?holistic?representation?of?the?spatial?envelope,International?Journal?of?Computer?Vision,Vol.42(3):145-175,2001]。

        本发明的效果和益处是:本发明提出一种基于图像哈希的大规模图像库检索方法,通过对已知标签的图像特征进行聚类,确定最优超球面分类面,构造哈希函数。这种哈希函数构造方法克服了LSH方法需要哈希函数多的问题;解决了语义哈希和谱哈希方法不能扩展到核空间地问题,同时也完善了KLSH方法计算哈希函数时对样本的选择问题。

        【附图说明】

        图1是一种基于图像哈希的大规模图像库检索方法的流程示意图。

        图2是本发明用于建立训练图像库的样本图像图。

        图3是其中4幅查询图像在24比特哈希值时检索返回的20幅图像,分两行显示,其中第一行最左边是查询图像图。

        图4是本发明不同哈希比特对应的检索准确率曲线图。

        图5是本发明不同哈希比特对应的检索召回率曲线图。

        【具体实施方式】

        以下结合技术方案和附图详细叙述本发明的具体实施方式。

        步骤1.图像库中包含5000幅1024×768像素的待检索图像,来源于公开的牛津大学建筑图像库。从中取出200幅用户感兴趣的图像作为训练图像,这200幅训练图像应包含同一对象,但允许对象的尺寸、角度、颜色和图像光强不同。部分训练图像样本如图2所示。

        图像库网址为://www.robots.ox.ac.uk/~vgg/data/oxbuildings/index.html

        步骤2.因为Gist描述符主要是提取图像的纹理特征,故,在此我们将5000幅待检索图像I={I1,I2,...,I5000}和200幅训练图像T={T1,T2,...,T200}由彩色图像变为灰度图像,并将其缩放至512×512像素。对I和T中的每一幅图像,在4个尺度,8个方向进行滤波,滤波后的图像进行4×4分块,获得其512维的Gist特征。待检索特征库和训练特征库分别为GI={GI1,GI2,...,GI5000}和GT={GT1,GT2,...,GT200}。

        Gist特征的提取过程可采用公开的matlab代码:

        //people.csail.mit.edu/torralba/code/spatialenvelope/

        步骤3.对于步骤2中200幅训练图像生成的训练特征GT={GT1,GT2,...,GT200},利用k均值聚类法将其聚成16类。对于每一组聚类样本Si,(1≤i≤16),定义超球面分类函数Pi(x)=Σi=1miαiK(xi,x),]]>其中mi是Si,(1≤i≤16)中包含的样本数;αi是mi维向量,通过训练得到;K(xi,x)是核函数,选择径向基核函数。根据已知的训练样本Si,(1≤i≤16),在约束条件为αi·xi>1,i=1,2,...,mi下,求解方程min(12||αi||2)]]>得到αi。αi确定后,该类的超球面分类函数Pi(x)=Σi=1miαiK(xi,x)]]>就确定了。依此类推,求解其他聚类样本的超球面分类函数。

        步骤4.根据步骤3中求得的超球面分类函数Pi(x)=Σi=1miaiK(xi,x),]]>定义哈希函数为H={H1,H2,...,H16},其中

        当已知加权向量αi后,对于待检索特征库中的每个样本GIi,(1≤i≤5000),利用H={H1(x),...,H16(x)}计算其哈希序列的值HIi={H1Ii,...,H16Ii},其中HjIi∈{0,1}。由于哈希序列是由0和1组成的,可以将每个哈希值作为1个比特,这样长度为16的哈希序列可以表示成16比特,也就是2个字节。相对于512维特征向量的512字节存储空间,哈希表示法极大的节省了存储空间。

        步骤5.对于任意一幅查询图像Q,按照步骤2至步骤4所述的方法为其生成哈希序列HQ={H1Q,...,H16Q},其中HjQ∈{0,1}。计算查询哈希序列HQ={H1Q,...,H16Q}和待检索图像的哈希序列HIi={H1Ii,...,H16Ii}之间的汉明距离DHiQ=∑xor(HIi,HQ),其中xor表示按位异或。

        为进一步提高检索速度,在计算汉明距离之前,我们对待检索图像进行预排除:如果某待检索图像的哈希序列为全零值,则认为该图像与查询图像不相似,将其排除。理由如下:训练样本是用户挑选的其感兴趣的图像,也就是与查询图像相关或者相似的图像。对训练样本进行聚类后,通过训练得到该类的超球面分类面,分类面方程由函数Pi(x)表示。另一方面,因为由函数Pi(x)所确定的哈希函数Hi(x)用于判断一个未知样本是否包含于分类面之内,也就是说是否属于该类,如果属于该类,则函数值为1,如果不属于,则为0。所以如果一个未知样本的10个哈希值都为0,则说明该样本不属于10类中的任何一类,也就说明该样本与查询图像不相似。

        步骤6.设定距离阈值为d。如果DHiQ<=d,则认为待检索图像Ii与查询图像Q相似,将其输出。距离阈值的取值由用户根据其检索准确率和召回率要求设定,在实验方案中,我们取d=1。

        步骤7.对于大量不同的查询图像,根据检索结果,统计检索准确率和召回率。图3是4幅查询图像在距离阈值d=1时返回的检索图像,因篇幅限制,仅列出其中20幅检索图像。不同哈希比特数对应的检索准确率和召回率也不相同,如图4和图5所示。从图4和图5可得出如下结论,选择24比特哈希序列可得到最优的检索准确率和召回率。

        以上内容是结合最佳实施方案对本发明所作的进一步详细说明,不能认定本发明的具体实施只限于这些说明。本领域的技术人员应该理解,在不脱离由所附权利要求书限定的情况下,可以在细节上进行各种修改,都应当视为属于本发明的?;し段?。

    关于本文
    本文标题:基于图像哈希的大规模图像库检索方法.pdf
    链接地址://www.4mum.com.cn/p-5781944.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 天津快乐10分几点开奖结果今天晚上 山西快乐十分前三遗漏号码 签到送金币3000炸金花 白小姐码报纸 旺旺彩票苹果 新快3下载 福彩3d最有效的赚钱法子 3D311期的开奖号码预测 篮彩改期 摆摊小吃车卖烧烤赚钱吗 25选7第97开奖 德州扑克 老时时彩三星四码遗漏 广西快3走势图 韩国快乐8 下载云南十一选五开奖