• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 11
    • 下载费用:20 金币  

    重庆时时彩咋赚钱: 一种高效的倒排索引结构及组织方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201210511478.1

    申请日:

    2012.12.04

    公开号:

    CN103853772A

    公开日:

    2014.06.11

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20121204|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 北京拓尔思信息技术股份有限公司
    发明人: 王弘蔚
    地址: 100088 北京市海淀区知春路6号锦秋国际大厦14层14B04
    优先权:
    专利代理机构: 代理人:
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201210511478.1

    授权公告号:

    ||||||

    法律状态公告日:

    2017.02.08|||2014.07.09|||2014.06.11

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明公开了一种高效的倒排索引结构及组织方法。将记录倒排项和属性倒排项分开存储,减少信息冗余;采用分块方式对倒排索引进行存储,以数据库索引优化为切入点,综合利用链表和集中定位表的优势对倒排块进行管理,既有利于索引动态维护又便于SKIP技术下的随即访问;同时根据域间关联关系,采用了压缩技术,以达到尽量少的空间存储尽量多的信息量。所提供的倒排索引结构及组织方法,减少了存储空间、优化了访问时间,在一定程度解决了倒排索引优化问题,能够实现海量数据的有效管理。

    权利要求书

    权利要求书
    1.  一种高效倒排索引结构,其特征在于,该倒排索引由倒排项组成,倒排项被拆分成记录倒排项和属性倒排项,由此倒排索引被分为记录倒排索引和属性倒排索引。

    2.  根据权利要求1所述的高效倒排索引结构,其特征在于,记录倒排索引由记录倒排项组成,“记录倒排项”由“记录号”独立形成,包括“记录号”和“链接器”;“记录号”是一个字段值或全文数据库中的词在数据库中出现时所在的记录;“链接器”的具体内容取决于不同的组织方式,其功能是能快速定位和读取一个词在该记录中的所有属性项。

    3.  根据权利要求1所述的高效倒排索引结构,其特征在于,属性倒排索引由属性倒排项构成,“属性倒排项”由“位置属性”和“格式属性”组成;“位置属性”是全文数据中的词在当前记录中出现的位置之一,位置属性分为三个层次“段落、句子、位置”;“格式属性”是全文数据中的词在出现位置所具有的其它格式信息。

    4.  一种高效倒排索引组织方法,其特征在于,倒排索引采用分块方式进行组织存储,倒排块综合采用链表和集中定位表进行管理。

    5.  根据权利要求4所述的高效倒排索引组织方法,其特征在于,以数据库索引的优化为临界点选择倒排块的管理方式,集中定位表被看成是一个特殊的链表节点,采用标志位机制来区分。

    6.  根据权利要求4所述的高效倒排索引组织方法,其特征在于,属性倒排项数据块放在记录倒排项数据块的后面,组合存储在同一文件的同一倒排项数据块中,简称倒排块。

    7.  根据权利要求4和权利要求5所述的高效倒排索引组织方法,其特征在于,倒排链表块由“链接器”和“倒排项数据块”组成,“链接器”的基本作用是指示下一倒排块或集中定位表的首地址,其中含1个标志位指明下一地址指向的是倒排链表还是集中定位表。

    8.  根据权利要求4和权利要求5所述的高效倒排索引组织方法,其特征在于,集中定位表由“表头”和“表项”组成,倒排段分块存储,表项按记录号进行分页。

    9.  根据权利要求4和权利要求8所述的高效倒排索引组织方法,其特征在于,集中定位表中一个表项相对于一个倒排块,每个倒排块需含“倒排块地址”、“最大记录号”、“最小记录号”和“页码表长度”。

    10.  根据权利要求9所述的高效倒排索引组织方法,其特征在于,页码表长度用于存储一个记录号的页码表的长度,页码表之后是记录号偏移表的起始地址,“页码表长度”域中1位标志位,区分倒排块是否分页,不分页时,低位用于表示属性偏移量,反之则表示记录号偏移量。

    11.  根据权利要求4、权利要求6和权利要求7所述的高效倒排索引组织方法,其特征在于,倒排项数据块分为记录倒排项数据库和属性倒排项数据库块,属性倒排项所含子项包括:段落、句子、位置、格式,不同的组合方式可形成8中具体的形式,依次为:<位置>、<句子,位置>、<段落,位置>、<段落,句子,位置>、<位置,格式>、<句子,位置,格式>、<段落,位置,格式>、<段落,句子,位置,格式>。

    12.  根据权利要求11所述的高效倒排索引组织方法,其特征在于,在倒排链表中,记录倒排项由“记录号”和“链接器”组成,一个记录的所有属性倒排项以及记录之间的属性倒排项在属性倒排项数据块中都是连续存放的,“链接器”的作用是指示该记录的所有属性倒排项在属性倒排项数据块中的起始位置。

    13.  根据权利要求11所述的高效倒排索引组织方法,其特征在于,在集中定位表中,记录倒排项在存储上分为“记录号页码表”表项和“记录号偏移表”表项,每个“记录号页码表”存储一个页的记录号页码以及所对应的记录号偏移表的定位信息,“记录号偏移表”由“记录号偏移”和“属性偏移量”两个域组成,在集中定位表“表项”的“页码表长度”域中进行标记组织。

    关 键 词:
    一种 高效 索引 结构 组织 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种高效的倒排索引结构及组织方法.pdf
    链接地址://www.4mum.com.cn/p-6147930.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03