• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 13
    • 下载费用:30 金币  

    彩讯网重庆时时彩计划: 网页内容对搜索引擎可见度的分析方法及装置.pdf

    关 键 词:
    网页 内容 搜索引擎 可见度 分析 方法 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201510894827.6

    申请日:

    2015.11.27

    公开号:

    CN106815278A

    公开日:

    2017.06.09

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G06F 17/30申请日:20151127|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 北京国双科技有限公司
    发明人: 姜世豪; 杨韬
    地址: 100086 北京市海淀区双榆树小区知春路76号翠宫饭店8层A间
    优先权:
    专利代理机构: 北京康信知识产权代理有限责任公司 11240 代理人: 韩建伟;李志刚
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201510894827.6

    授权公告号:

    |||

    法律状态公告日:

    2017.07.04|||2017.06.09

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本申请公开了一种网页内容对搜索引擎可见度的分析方法及装置。该方法包括:通过预设提取工具提取目标网页源代码中的关键词,得到关键词集合,其中,关键词集合为在目标网页内容中出现的频次在预设范围内的关键词组成的集合,关键词集合中每个关键词在目标网页中出现的频次记为第一频次;在浏览器中加载目标网页后分别统计关键词集合中每个关键词出现的频次,得到每个关键词对应的第二频次;分别根据每个关键词对应的第一频次和每个关键词对应的第二频次计算关键词可见率,得到每个关键词可见率;根据每个关键词可见率分析目标网页中关键词对搜索引擎的可见度。通过本申请,解决了相关技术中分析网页中的内容对搜索引擎可见度准确率较低的问题。

    权利要求书

    1.一种网页内容对搜索引擎可见度的分析方法,其特征在于,包括:
    通过预设提取工具提取目标网页源代码中的关键词,得到关键词集合,其中,
    所述关键词集合为在所述目标网页内容中出现的频次在预设范围内的关键词组成
    的集合,所述关键词集合中每个关键词在所述目标网页中出现的频次记为第一频
    次;
    在浏览器中加载所述目标网页后分别统计所述关键词集合中每个关键词出现
    的频次,得到所述每个关键词对应的第二频次;
    分别根据所述每个关键词对应的第一频次和所述每个关键词对应的第二频次
    计算关键词可见率,得到每个关键词可见率;以及
    根据所述每个关键词可见率分析所述目标网页中关键词对搜索引擎的可见
    度。
    2.根据权利要求1所述的方法,其特征在于,在根据所述每个关键词可见率分析所
    述目标网页中关键词对搜索引擎的可见度之后,所述方法还包括:
    将所述每个关键词对应的第一频次相加,得到第一频次总和;
    将所述每个关键词对应的第二频次相加,得到第二频次总和;
    根据所述第一频次总和与所述第二频次总和计算目标网页内容可见率;以及
    根据所述目标网页内容可见率分析所述目标网页中内容对所述搜索引擎的可
    见度。
    3.根据权利要求1所述的方法,其特征在于,根据所述每个关键词可见率分析所述
    目标网页中关键词对搜索引擎的可见度包括:
    在所述每个关键词可见率中选取大于预设可见率的关键词可见率,并提取选
    取到的关键词可见率对应的关键词,得到第一关键词子集合;
    判定所述搜索引擎抓取所述第一关键词子集合中关键词的抓取概率大于预设
    抓取概率;
    在所述每个关键词可见率中选取小于或等于所述预设可见率的关键词可见
    率,并提取选取到的关键词可见率对应的关键词,得到第二关键词子集合;以及
    判定所述搜索引擎抓取所述第二关键词子集合中关键词的抓取概率小于所述
    预设抓取概率。
    4.根据权利要求1所述的方法,其特征在于,通过预设提取工具提取目标网页源代
    码中的关键词,得到关键词集合包括:
    采用预设提取工具针对目标网页提取关键词,其中,提取的关键词为在所述
    目标网页中出现的频次在预设范围内的关键词;
    从所述提取的关键词中进行筛选得到目标关键词;以及
    通过所述目标关键词组成所述关键词集合。
    5.根据权利要求1所述的方法,其特征在于,
    在得到所述每个关键词可见率之后,在根据所述每个关键词可见率分析所述
    目标网页中关键词对搜索引擎的可见度之前,所述方法还包括:根据每个关键词
    和所述每个关键词对应的关键词可见率构建目标列表;发送所述目标列表至目标
    地址,
    根据所述每个关键词可见率分析所述目标网页中关键词对搜索引擎的可见度
    包括:在所述目标地址上获取所述目标列表中的每个关键词和所述每个关键词对
    应的关键词可见率;以及分别根据所述目标列表中的每个关键词和所述每个关键
    词对应的关键词可见率分析所述目标网页中关键词对搜索引擎的可见度。
    6.一种网页内容对搜索引擎可见度的分析装置,其特征在于,包括:
    提取单元,用于通过预设提取工具提取目标网页源代码中的关键词,得到关
    键词集合,其中,所述关键词集合为在所述目标网页内容中出现的频次在预设范
    围内的关键词组成的集合,所述关键词集合中每个关键词在所述目标网页中出现
    的频次记为第一频次;
    统计单元,用于在浏览器中加载所述目标网页后分别统计所述关键词集合中
    每个关键词出现的频次,得到所述每个关键词对应的第二频次;
    第一计算单元,用于分别根据所述每个关键词对应的第一频次和所述每个关
    键词对应的第二频次计算关键词可见率,得到每个关键词可见率;以及
    第一分析单元,用于根据所述每个关键词可见率分析所述目标网页中关键词
    对搜索引擎的可见度。
    7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
    第二计算单元,用于将所述每个关键词对应的第一频次相加,得到第一频次
    总和;
    第三计算单元,用于将所述每个关键词对应的第二频次相加,得到第二频次
    总和;
    第四计算单元,用于根据所述第一频次总和与所述第二频次总和计算目标网
    页内容可见率;以及
    第二分析单元,用于根据所述目标网页内容可见率分析所述目标网页中内容
    对所述搜索引擎的可见度。
    8.根据权利要求6所述的装置,其特征在于,所述第一分析单元包括:
    第一提取???,用于在所述每个关键词可见率中选取大于预设可见率的关键
    词可见率,并提取选取到的关键词可见率对应的关键词,得到第一关键词子集合;
    第一判断???,用于判定所述搜索引擎抓取所述第一关键词子集合中关键词
    的抓取概率大于预设抓取概率;
    第二提取???,用于在所述每个关键词可见率中选取小于或等于所述预设可
    见率的关键词可见率,并提取选取到的关键词可见率对应的关键词,得到第二关
    键词子集合;以及
    第二判断???,用于判定所述搜索引擎抓取所述第二关键词子集合中关键词
    的抓取概率小于所述预设抓取概率。
    9.根据权利要求6所述的装置,其特征在于,所述提取单元包括:
    第三提取???,用于采用预设提取工具针对目标网页提取关键词,其中,提
    取的关键词为在所述目标网页中出现的频次在预设范围内的关键词;
    筛选???,用于从所述提取的关键词中进行筛选得到目标关键词;以及
    构建???,用于通过所述目标关键词组成所述关键词集合。
    10.根据权利要求6所述的装置,其特征在于,
    所述装置还包括:构建单元,用于根据每个关键词和所述每个关键词对应的
    关键词可见率构建目标列表;发送单元,用于发送所述目标列表至目标地址,
    第一分析单元还用于在所述目标地址上获取所述目标列表中的每个关键词和
    所述每个关键词对应的关键词可见率;以及分别根据所述目标列表中的每个关键
    词和所述每个关键词对应的关键词可见率分析所述目标网页中关键词对搜索引擎
    的可见度。

    说明书

    网页内容对搜索引擎可见度的分析方法及装置

    技术领域

    本申请涉及互联网领域,具体而言,涉及一种网页内容对搜索引擎可见度的分析
    方法及装置。

    背景技术

    随着搜索引擎技术的不断进步,从第一代搜索引擎至今,基于搜索算法的结果展
    现越来越贴近用户的需求,具有精确、多样化等特点。但到目前为止,搜索引擎对于
    网页中所使用的Javascript代码内容仍处于学习阶段,进而通过Javascript方式在浏览
    器中异步加载的链接、文字内容仍然无法在关键词排名中获得好的表现。因此,判断
    网页中核心内容是否采用搜索引擎不能识别(即被搜索引擎不可见)的方式加载,仍
    然是评价网页搜索引擎优化(SEO)质量的重要环节。相关技术中,通常搜索引擎在
    网页源代码中抓取有用信息,并剔除冗余信息。为了判断网页中内容对搜索引擎可见
    度,即判断搜索引擎在抓取源代码信息过程中,文字和链接是否对搜索引擎可见,现
    有的方式是在网页的文字和链接中随机选取重要的内容,将其在网站源代码中进行查
    找,若无对应的查找结果,可初步判断该文字内容是通过异步加载方式呈现在浏览器
    中,在源代码中对搜索引擎不可见。然而通过浏览器随机选取内容,并在源代码中查
    找的方式,存在的问题主要有:人工选取样本的随机性较大,无法涵盖大部分内容的
    检查;人工选取样本的效率较低,无法在短时间内定位核心内容;人工选取样本检查
    结果难以量化,无法提供代表性的指标。

    针对相关技术中分析网页中的内容对搜索引擎可见度准确率较低的问题,目前尚
    未提出有效的解决方案。

    发明内容

    本申请的主要目的在于提供一种网页内容对搜索引擎可见度的分析方法及装置,
    以解决相关技术中分析网页中的内容对搜索引擎可见度准确率较低的问题。

    为了实现上述目的,根据本申请的一个方面,提供了一种网页内容对搜索引擎可
    见度的分析方法。该方法包括:通过预设提取工具提取目标网页源代码中的关键词,
    得到关键词集合,其中,关键词集合为在目标网页内容中出现的频次在预设范围内的
    关键词组成的集合,关键词集合中每个关键词在目标网页中出现的频次记为第一频次;
    在浏览器中加载目标网页后分别统计关键词集合中每个关键词出现的频次,得到每个
    关键词对应的第二频次;分别根据每个关键词对应的第一频次和每个关键词对应的第
    二频次计算关键词可见率,得到每个关键词可见率;以及根据每个关键词可见率分析
    目标网页中关键词对搜索引擎的可见度。

    进一步地,在根据每个关键词可见率分析目标网页中关键词对搜索引擎的可见度
    之后,该方法还包括:将每个关键词对应的第一频次相加,得到第一频次总和;将每
    个关键词对应的第二频次相加,得到第二频次总和;根据第一频次总和与第二频次总
    和计算目标网页内容可见率;以及根据目标网页内容可见率分析目标网页中内容对搜
    索引擎的可见度。

    进一步地,根据每个关键词可见率分析目标网页中关键词对搜索引擎的可见度包
    括:在每个关键词可见率中选取大于预设可见率的关键词可见率,并提取选取到的关
    键词可见率对应的关键词,得到第一关键词子集合;判定搜索引擎抓取第一关键词子
    集合中关键词的抓取概率大于预设抓取概率;在每个关键词可见率中选取小于或等于
    预设可见率的关键词可见率,并提取选取到的关键词可见率对应的关键词,得到第二
    关键词子集合;以及判定搜索引擎抓取第二关键词子集合中关键词的抓取概率小于预
    设抓取概率。

    进一步地,通过预设提取工具提取目标网页源代码中的关键词,得到关键词集合
    包括:采用预设提取工具针对目标网页提取关键词,其中,提取的关键词为在目标网
    页中出现的频次在预设范围内的关键词;从提取的关键词中进行筛选得到目标关键词;
    以及通过目标关键词组成关键词集合。

    进一步地,在得到每个关键词可见率之后,在根据每个关键词可见率分析目标网
    页中关键词对搜索引擎的可见度之前,该方法还包括:根据每个关键词和每个关键词
    对应的关键词可见率构建目标列表;发送目标列表至目标地址,根据每个关键词可见
    率分析目标网页中关键词对搜索引擎的可见度包括:在目标地址上获取目标列表中的
    每个关键词和每个关键词对应的关键词可见率;以及分别根据目标列表中的每个关键
    词和每个关键词对应的关键词可见率分析目标网页中关键词对搜索引擎的可见度。

    为了实现上述目的,根据本申请的另一方面,提供了一种网页内容对搜索引擎可
    见度的分析装置。该装置包括:提取单元,用于通过预设提取工具提取目标网页源代
    码中的关键词,得到关键词集合,其中,关键词集合为在目标网页内容中出现的频次
    在预设范围内的关键词组成的集合,关键词集合中每个关键词在目标网页中出现的频
    次记为第一频次;统计单元,用于在浏览器中加载目标网页后分别统计关键词集合中
    每个关键词出现的频次,得到每个关键词对应的第二频次;第一计算单元,用于分别
    根据每个关键词对应的第一频次和每个关键词对应的第二频次计算关键词可见率,得
    到每个关键词可见率;以及第一分析单元,用于根据每个关键词可见率分析目标网页
    中关键词对搜索引擎的可见度。

    进一步地,该装置还包括:第二计算单元,用于将每个关键词对应的第一频次相
    加,得到第一频次总和;第三计算单元,用于将每个关键词对应的第二频次相加,得
    到第二频次总和;第四计算单元,用于根据第一频次总和与第二频次总和计算目标网
    页内容可见率;以及第二分析单元,用于根据目标网页内容可见率分析目标网页中内
    容对搜索引擎的可见度。

    进一步地,第一分析单元包括:第一提取???,用于在每个关键词可见率中选取
    大于预设可见率的关键词可见率,并提取选取到的关键词可见率对应的关键词,得到
    第一关键词子集合;第一判断???,用于判定搜索引擎抓取第一关键词子集合中关键
    词的抓取概率大于预设抓取概率;第二提取???,用于在每个关键词可见率中选取小
    于或等于预设可见率的关键词可见率,并提取选取到的关键词对应的关键词,得到第
    二关键词子集合;以及第二判断???,用于判定搜索引擎抓取第二关键词子集合中关
    键词的抓取概率小于预设抓取概率。

    进一步地,提取单元包括:第三提取???,用于采用预设提取工具针对目标网页
    提取关键词,其中,提取的关键词为在目标网页中出现的频次在预设范围内的关键词;
    筛选???,用于从提取的关键词中进行筛选得到目标关键词;以及构建???,用于通
    过目标关键词组成关键词集合。

    进一步地,该装置还包括:构建单元,用于根据每个关键词和每个关键词对应的
    关键词可见率构建目标列表;发送单元,用于发送目标列表至目标地址,第一分析单
    元还用于在目标地址上获取目标列表中的每个关键词和每个关键词对应的关键词可见
    率;以及分别根据目标列表中的每个关键词和每个关键词对应的关键词可见率分析目
    标网页中关键词对搜索引擎的可见度。

    通过本申请,采用以下步骤:通过预设提取工具提取目标网页源代码中的关键词,
    得到关键词集合,其中,关键词集合为在目标网页内容中出现的频次在预设范围内的
    关键词组成的集合,关键词集合中每个关键词在目标网页中出现的频次记为第一频次;
    在浏览器中加载目标网页后分别统计关键词集合中每个关键词出现的频次,得到每个
    关键词对应的第二频次;分别根据每个关键词对应的第一频次和每个关键词对应的第
    二频次计算关键词可见率,得到每个关键词可见率;以及根据每个关键词可见率分析
    目标网页中关键词对搜索引擎的可见度,解决了相关技术中分析网页中的内容对搜索
    引擎可见度准确率较低的问题。通过预设提取工具已有的分析单页面关键词出现频次
    功能,可以模拟搜索引擎蜘蛛,从源代码的角度剖析页面,并提取搜索引擎可识别的
    内容;在此基础上反查询这些源代码中高频词关键词在浏览器端的出现频次,可以直
    观的得到每个关键词从用户角度来看出现的频次,而这两者之间的差值即为用户可见
    但搜索引擎不可见的内容,将此指标量化,进而达到了提升分析网页中的内容对搜索
    引擎可见度准确率的效果。

    附图说明

    构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实
    施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

    图1是根据本申请实施例的网页内容对搜索引擎可见度的分析方法的流程图;以

    图2是根据本申请实施例的网页内容对搜索引擎可见度的分析装置的示意图。

    具体实施方式

    需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相
    互组合。下面将参考附图并结合实施例来详细说明本申请。

    为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的
    附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例
    仅仅是本申请一部分的实施例,而不是全部的实施例?;诒旧昵胫械氖凳├?,本领
    域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于
    本申请?;さ姆段?。

    需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第
    二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这
    样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语
    “包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含
    了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步
    骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的
    其它步骤或单元。

    为了便于描述,以下对本申请实施例涉及的术语进行说明:

    搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联
    网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关
    的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜
    索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。

    根据本申请的实施例,提供了一种网页内容对搜索引擎可见度的分析方法。

    图1是根据本申请实施例的网页内容对搜索引擎可见度的分析方法的流程图。如
    图1所示,该方法包括以下步骤:

    步骤S101,通过预设提取工具提取目标网页源代码中的关键词,得到关键词集合,
    其中,关键词集合为在目标网页内容中出现的频次在预设范围内的关键词组成的集合,
    关键词集合中每个关键词在目标网页中出现的频次记为第一频次。

    本申请中的预设提取工具可以为网站与搜索引擎优化分析工具,为用户提供一种
    检测用户自身网站质量以及搜索引擎检索质量的分析方法。借助该工具,用户可以对
    自己的网站进行综合评价,发现网站的不足之处加以改进。同时该工具能够通过关键
    词检索,提供整个网站在搜索引擎中的自然搜索排名情况,为用户提供全方位的质量
    分析报告,使用户能够更精准更有效的对自身网站做出优化。

    本申请中的提取网页关键词的方法与搜索引擎统计网页关键词的方式相同,即通
    过源代码来提取。

    可选地,在本申请实施例提供的网页内容对搜索引擎可见度的分析方法中,通过
    预设提取工具提取目标网页源代码中的关键词,得到关键词集合包括:采用预设提取
    工具针对目标网页提取关键词,其中,提取的关键词为在目标网页中出现的频次在预
    设范围内的关键词;从提取的关键词中进行筛选得到目标关键词;以及通过目标关键
    词组成关键词集合。

    例如,网站与搜索引擎优化分析工具可以从单一页面(目标页面)源代码中提取
    出最多20个频次最高(频次在预设范围内)的关键词,根据实际情况,可以从中选取
    前10个关键词,或者筛选出一定数量的有效关键词,作为目标关键词,来建立关键词
    表作为初始数据。例如,提取目标网页URL为www.abc.com的关键词,得到结果如
    下表1所示:

    表1

    关键词
    第一频次
    Keyword1
    a1
    Keyword2
    a2
    Keyword3
    a3


    步骤S102,在浏览器中加载目标网页后分别统计关键词集合中每个关键词出现的
    频次,得到每个关键词对应的第二频次。

    由于在浏览器中加载目标网页后在浏览器中显示的关键词,源代码中有可能不显
    示,但源代码中显示的,浏览器中一定显示。在浏览器中打开上述的目标网页,利用
    浏览器查找功能,分别对上述提取到的每个关键词进行统计出现的频次,并记录该关
    键词在浏览器端返回的出现频次数据,即可获知上述提取到的关键词在浏览器中是否
    显示与显示的频次。

    例如,在浏览器中打开URL为www.abc.com的目标网页,对Keyword1,Keywo
    rd2…等等,分别统计其在浏览器中出现的频次,得到结果如下表2所示:

    表2

    关键词
    第二频次
    Keyword1
    b1
    Keyword2
    b2
    Keyword3
    b3


    步骤S103,分别根据每个关键词对应的第一频次和每个关键词对应的第二频次计
    算关键词可见率,得到每个关键词可见率。

    根据上述得到的每个关键词对应的第一频次和第二频次,计算出每个关键词可见
    率,每个关键词可见率即为每个关键词的可见率,得到结果如下表3所示:

    表3

    关键词
    第一频次
    第二频次
    关键词可见率
    Keyword1
    a1
    b1
    a1/b1*100%
    Keyword2
    a2
    b2
    a2/b2*100%
    Keyword3
    a3
    b3
    a3/b3*100%
    Keyword4
    a4
    b4
    a4/b4*100%




    步骤S104,根据每个关键词可见率分析目标网页中关键词对搜索引擎的可见度。

    根据上述得到的每一个Keyword对应的关键词可见率,可以分析每个关键词对搜
    索引擎的可见度。

    可选地,在本申请实施例提供的网页内容对搜索引擎可见度的分析方法中,根据
    每个关键词可见率分析目标网页中关键词对搜索引擎的可见度包括:在每个关键词可
    见率中选取大于预设可见率的关键词可见率,并提取选取到的关键词可见率对应的关
    键词,得到第一关键词子集合;判定搜索引擎抓取第一关键词子集合中关键词的抓取
    概率大于预设抓取概率;在每个关键词可见率中选取小于或等于预设可见率的关键词
    可见率,并提取选取到的关键词可见率对应的关键词,得到第二关键词子集合;以及
    判定搜索引擎抓取第二关键词子集合中关键词的抓取概率小于预设抓取概率。

    例如,某个关键词对应的关键词可见率为A%,预设可见率为B%,如果A%>B%,
    则搜索引擎抓取到的该关键词的比例较高,如果A%≤B%,则搜索引擎抓取到的该关
    键词的比例较低,搜索引擎优化相关表现越不理想,该关键词越难在搜索引擎排名中
    展现。需要后续对该目标网页的代码进行调整,对该网页内容进行优化。

    可选地,在本申请实施例提供的网页内容对搜索引擎可见度的分析方法中,在得
    到每个关键词可见率之后,在根据每个关键词可见率分析目标网页中关键词对搜索引
    擎的可见度之前,该方法还包括:根据每个关键词和每个关键词对应的关键词可见率
    构建目标列表;发送目标列表至目标地址,根据每个关键词可见率分析目标网页中关
    键词对搜索引擎的可见度包括:在目标地址上获取目标列表中的每个关键词和每个关
    键词对应的关键词可见率;以及分别根据目标列表中的每个关键词和每个关键词对应
    的关键词可见率分析目标网页中关键词对搜索引擎的可见度。

    通过将每个关键词和每个关键词对应的关键词可见率构建目标列表发送至目标地
    址,用户在目标地址上可以直观的获取到各个关键词和其对于的可见率,可以有针对
    性的在网页上调整各个关键词的源代码,从而对搜索引擎优化工作具有重要的指导意
    义。

    可选地,在本申请实施例提供的网页内容对搜索引擎可见度的分析方法中,在根
    据每个关键词可见率分析目标网页中关键词对搜索引擎的可见度之后,该方法还包括:
    将每个关键词对应的第一频次相加,得到第一频次总和;将每个关键词对应的第二频
    次相加,得到第二频次总和;根据第一频次总和与第二频次总和计算目标网页内容可
    见率;以及根据目标网页内容可见率分析目标网页中内容对搜索引擎的可见度。

    具体地,记统计出的关键词总数为n,目标网页内容可见率=在网站与搜索引擎优
    化分析工具上出现频次总和/在浏览器中出现频次总和*100%,即目标网页内容可见率
    =sum(a1:an)/sum(b1:bn)*100%,目标网页中统计出的关键词级能够反映该页面中最核
    心的内容,即目标网页内容可见率反映了该页面中最核心的内容(出现频率最高的关
    键词)中有多少是可以被搜索引擎正常抓取的。

    通过以上步骤,利用网站与搜索引擎优化分析工具已有的分析单页面关键词出现
    频次功能,可以模拟搜索引擎蜘蛛,从源代码的角度剖析页面,并提取搜索引擎可识
    别的内容;在此基础上反查询这些源代码中高频词关键词在浏览器端的出现频次,可
    以直观的得到每个关键词从用户角度来看出现的频次,而这两者之间的差值即为用户
    可见但搜索引擎不可见的内容,将此指标量化,对于搜索引擎优化工作具有重要的指
    导意义。

    本申请实施例提供的网页内容对搜索引擎可见度的分析方法,通过预设提取工具
    提取目标网页源代码中的关键词,得到关键词集合,其中,关键词集合为在目标网页
    内容中出现的频次在预设范围内的关键词组成的集合,关键词集合中每个关键词在目
    标网页中出现的频次记为第一频次;在浏览器中加载目标网页后分别统计关键词集合
    中每个关键词出现的频次,得到每个关键词对应的第二频次;分别根据每个关键词对
    应的第一频次和每个关键词对应的第二频次计算关键词可见率,得到每个关键词可见
    率;以及根据每个关键词可见率分析目标网页中关键词对搜索引擎的可见度,解决了
    相关技术中分析网页中的内容对搜索引擎可见度准确率较低的问题。通过预设提取工
    具已有的分析单页面关键词出现频次功能,可以模拟搜索引擎蜘蛛,从源代码的角度
    剖析页面,并提取搜索引擎可识别的内容;在此基础上反查询这些源代码中高频词关
    键词在浏览器端的出现频次,可以直观的得到每个关键词从用户角度来看出现的频次,
    而这两者之间的差值即为用户可见但搜索引擎不可见的内容,将此指标量化,进而达
    到了提升分析网页中的内容对搜索引擎可见度准确率的效果。

    需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的
    计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可
    以以不同于此处的顺序执行所示出或描述的步骤。

    本申请实施例还提供了一种网页内容对搜索引擎可见度的分析装置,需要说明的
    是,本申请实施例的网页内容对搜索引擎可见度的分析装置可以用于执行本申请实施
    例所提供的用于网页内容对搜索引擎可见度的分析方法。以下对本申请实施例提供的
    网页内容对搜索引擎可见度的分析装置进行介绍。

    图2是根据本申请实施例的网页内容对搜索引擎可见度的分析装置的示意图。如
    图2所示,该装置包括:提取单元10、统计单元20、第一计算单元30和第一分析单
    元40。

    提取单元10,用于通过预设提取工具提取目标网页源代码中的关键词,得到关键
    词集合,其中,关键词集合为在目标网页内容中出现的频次在预设范围内的关键词组
    成的集合,关键词集合中每个关键词在目标网页中出现的频次记为第一频次。

    统计单元20,用于在浏览器中加载目标网页后分别统计关键词集合中每个关键词
    出现的频次,得到每个关键词对应的第二频次。

    第一计算单元30,用于分别根据每个关键词对应的第一频次和每个关键词对应的
    第二频次计算关键词可见率,得到每个关键词可见率。

    第一分析单元40,用于根据每个关键词可见率分析目标网页中关键词对搜索引擎
    的可见度。

    本申请实施例提供的网页内容对搜索引擎可见度的分析装置,通过提取单元10
    通过预设提取工具提取目标网页源代码中的关键词,得到关键词集合,其中,关键词
    集合为在目标网页内容中出现的频次在预设范围内的关键词组成的集合,关键词集合
    中每个关键词在目标网页中出现的频次记为第一频次;统计单元20在浏览器中加载目
    标网页后分别统计关键词集合中每个关键词出现的频次,得到每个关键词对应的第二
    频次;第一计算单元30分别根据每个关键词对应的第一频次和每个关键词对应的第二
    频次计算关键词可见率,得到每个关键词可见率;以及第一分析单元40根据每个关键
    词可见率分析目标网页中关键词对搜索引擎的可见度,解决了相关技术中分析网页中
    的内容对搜索引擎可见度准确率较低的问题,通过预设提取工具已有的分析单页面关
    键词出现频次功能,可以模拟搜索引擎蜘蛛,从源代码的角度剖析页面,并提取搜索
    引擎可识别的内容;在此基础上反查询这些源代码中高频词关键词在浏览器端的出现
    频次,可以直观的得到每个关键词从用户角度来看出现的频次,而这两者之间的差值
    即为用户可见但搜索引擎不可见的内容,将此指标量化,进而达到了提升分析网页中
    的内容对搜索引擎可见度准确率的效果。

    可选地,在本申请实施例提供的网页内容对搜索引擎可见度的分析装置中,该装
    置还包括:第二计算单元,用于将每个关键词对应的第一频次相加,得到第一频次总
    和;第三计算单元,用于将每个关键词对应的第二频次相加,得到第二频次总和;第
    四计算单元,用于根据第一频次总和与第二频次总和计算目标网页内容可见率;以及
    第二分析单元,用于根据目标网页内容可见率分析目标网页中内容对搜索引擎的可见
    度。

    可选地,在本申请实施例提供的网页内容对搜索引擎可见度的分析装置中,第一
    分析单元40包括:第一提取???,用于在每个关键词可见率中选取大于预设可见率的
    关键词可见率,并提取选取到的关键词可见率对应的关键词,得到第一关键词子集合;
    第一判断???,用于判定搜索引擎抓取第一关键词子集合中关键词的抓取概率大于预
    设抓取概率;第二提取???,用于在每个关键词可见率中选取小于或等于预设可见率
    的关键词可见率,并提取选取到的关键词可见率对应的关键词,得到第二关键词子集
    合;以及第二判断???,用于判定搜索引擎抓取第二关键词子集合中关键词的抓取概
    率小于预设抓取概率。

    可选地,在本申请实施例提供的网页内容对搜索引擎可见度的分析装置中,提取
    单元10包括:第三提取???,用于采用预设提取工具针对目标网页提取关键词,其中,
    提取的关键词为在目标网页中出现的频次在预设范围内的关键词;筛选???,用于从
    提取的关键词中进行筛选得到目标关键词;以及构建???,用于通过目标关键词组成
    关键词集合。

    可选地,在本申请实施例提供的网页内容对搜索引擎可见度的分析装置中,该装
    置还包括:构建单元,用于根据每个关键词和每个关键词对应的关键词可见率构建目
    标列表;发送单元,用于发送目标列表至目标地址,第一分析单元还用于在目标地址
    上获取目标列表中的每个关键词和每个关键词对应的关键词可见率;以及分别根据目
    标列表中的每个关键词和每个关键词对应的关键词可见率分析目标网页中关键词对搜
    索引擎的可见度。

    网页内容对搜索引擎可见度的分析装置包括处理器和存储器,上述提取单元、统
    计单元、第一计算单元和第一分析单元等均作为程序单元存储在存储器中,由处理器
    执行存储在存储器中的上述程序单元实现相应功能。

    处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个
    或以上,通过调整内核参数分析网页内容对搜索引擎可见度。

    存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/
    或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一
    个存储芯片。

    本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适
    于执行初始化有如下方法步骤的程序代码:通过预设提取工具提取目标网页源代码中
    的关键词,得到关键词集合,其中,关键词集合为在目标网页内容中出现的频次在预
    设范围内的关键词组成的集合,关键词集合中每个关键词在目标网页中出现的频次记
    为第一频次;在浏览器中加载目标网页后分别统计关键词集合中每个关键词出现的频
    次,得到每个关键词对应的第二频次;分别根据每个关键词对应的第一频次和每个关
    键词对应的第二频次计算关键词可见率,得到每个关键词可见率;以及根据每个关键
    词可见率分析目标网页中关键词对搜索引擎的可见度。

    需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系
    列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限
    制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术
    人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和???br />并不一定是本申请所必须的。

    在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部
    分,可以参见其他实施例的相关描述。

    在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方
    式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅
    仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可
    以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

    所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显
    示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到
    多个网络单元上??梢愿菔导实男枰≡衿渲械牟糠只蛘呷康ピ词迪直臼凳├?br />方案的目的。

    另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以
    是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成
    的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

    显然,本领域的技术人员应该明白,上述的本申请的各??榛蚋鞑街杩梢杂猛ㄓ?br />的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所
    组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以
    将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模
    块,或者将它们中的多个??榛虿街柚谱鞒傻ジ黾傻缏纺?槔词迪?。这样,本申请
    不限制于任何特定的硬件和软件结合。

    以上所述仅为本申请的优选实施例,并不用于限制本申请,对于本领域的技术人
    员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何
    修改、等同替换、改进等,均应包含在本申请的?;し段е?。

    关于本文
    本文标题:网页内容对搜索引擎可见度的分析方法及装置.pdf
    链接地址://www.4mum.com.cn/p-6020965.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 云南时时app下载 七星彩大奖技巧 财神爷pk10定位计划 北京pk10网上骗局 pk10五码循环不死模式 11选5稳赚任6 新重庆时时开奖结果记录 11运夺金稳赚秘笈 重庆时时开彩结果记录 新疆时时三星和值 聚富世界下载安装 北京单场胜平负及投注 赛车双人游戏大全 9842大富翁三期内必开 时时彩稳赚的倍投方案 幸运飞艇大小单双心得