• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 11
    • 下载费用:30 金币  

    重庆时时彩手机安卓版: 一种检测网页隐藏内容的方法,及设备.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201210397725.X

    申请日:

    2012.10.18

    公开号:

    CN103778365A

    公开日:

    2014.05.07

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06F 21/51申请日:20121018|||公开
    IPC分类号: G06F21/51(2013.01)I; G06F21/56(2013.01)I 主分类号: G06F21/51
    申请人: 腾讯科技(深圳)有限公司
    发明人: 李永健; 周吉文; 庾洋
    地址: 518031 广东省深圳市福田区振兴路赛格科技园2栋东403室
    优先权:
    专利代理机构: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 唐华明
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201210397725.X

    授权公告号:

    ||||||

    法律状态公告日:

    2015.05.13|||2014.06.04|||2014.05.07

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明实施例公开了一种检测网页隐藏内容的方法,及设备。其中方法包括:通过加载页面,生成页面的描述信息和页面的布局信息;比较所述页面的描述信息以及所述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中;若否,则确定页面的描述信息中未包含在页面的布局信息中的标签节点为隐藏内容。以上实施例通过在排版引擎中加载页面,生成页面的描述信息和页面的布局信息,然后比较页面的描述信息和页面的布局信息,确定被隐藏的内容的方式不受种类的影响也不受是否加密的影响,因而可以准确的识别被隐藏的内容,提高了检测网页隐藏内容的准确率。

    权利要求书

    权利要求书
    1.  一种检测网页隐藏内容的方法,其特征在于,包括:
    通过加载页面,生成页面的描述信息和页面的布局信息;
    比较所述页面的描述信息以及所述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中;
    若否,则确定页面的描述信息中未包含在页面的布局信息中的标签节点为隐藏内容。

    2.  根据权利要求1所述方法,其特征在于,所述比较所述页面的描述信息以及所述页面的布局信息包括:
    在生成页面的描述信息和页面的布局信息,且经设定延迟时间之后,比较所述页面的描述信息以及所述页面的布局信息。

    3.  根据权利要求1所述方法,其特征在于,所述加载页面包括:使用排版引擎加载页面,并且在采用排版引擎加载页面之前还包括:
    将排版引擎的用户代理字符串设置为搜索引擎。

    4.  根据权利要求3所述方法,其特征在于,所述使用排版引擎加载页面包括:
    使用排版引擎加载统一资源定位符URL,并解析返回的超文本标记语言HTML代码,并加载所述HTML代码对应页面中的其他元素。

    5.  根据权利要求3或4所述方法,其特征在于,
    所述排版引擎为开源浏览器排版引擎;所述页面的描述信息为文档对象模型DOM树;所述页面的布局信息为描绘render树。

    6.  根据权利要求1至4任意一项所述方法,其特征在于,还包括
    若所述隐藏内容为具有指向URL功能的标签节点,且所述具有指向URL功能的标签节点指向外链,则确定所述页面被挂黑链。

    7.  一种检测网页隐藏内容的设备,其特征在于,包括:
    加载单元,用于通过加载页面,生成页面的描述信息和页面的布局信息;
    比较单元,用于比较所述页面的描述信息以及所述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中;
    内容确定单元,用于若比较确定单元确定为否,则确定页面的描述信息中未包含在页面的布局信息中的标签节点为隐藏内容。

    8.  根据权利要求7所述设备,其特征在于,
    所述比较单元,具体用于在生成页面的描述信息和页面的布局信息,且经设定延迟时间之后,比较所述页面的描述信息以及所述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中。

    9.  根据权利要求7所述设备,其特征在于,所述加载单元,具体用于使用排版引擎加载页面;所述设备还包括:
    加载控制单元,用于在所述使用排版引擎加载页面之前,将排版引擎的用户代理字符串设置为搜索引擎。

    10.  根据权利要求9所述设备,其特征在于,
    所述加载单元,具体用于使用排版引擎加载统一资源定位符URL,并解析返回的超文本标记语言HTML代码,并加载所述HTML代码对应页面中的其他元素。

    11.  根据权利要求9或10所述设备,其特征在于,
    所述加载单元,具体用于使用开源浏览器排版引擎加载页面,生成文档对象模型DOM树和描绘render树;
    所述比较单元,具体用于比较所述DOM树以及所述render树,确定DOM树的所有标签节点是否均包含在render树中;
    所述内容确定单元,具体用于若比较确定单元确定为否,则确定DOM树中未包含在render树中的标签节点为隐藏内容。

    12.  根据权利要求7至10任意一项所述设备,其特征在于,还包括
    内容确定子单元,用于若所述隐藏内容为具有指向URL功能的标签节点,且所述具有指向URL功能的标签节点指向外链,则确定所述页面被挂黑链。

    关 键 词:
    一种 检测 网页 隐藏 内容 方法 设备
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:一种检测网页隐藏内容的方法,及设备.pdf
    链接地址://www.4mum.com.cn/p-6156490.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03