• 浪潮孙丕恕从信息时代到智能时代 人工智能价值将爆发式释放 2019-12-21
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
    • / 11
    • 下载费用:30 金币  

    重庆时时彩只在重庆: 一种基于元数据保存存储信息及统计管理数据的方法.pdf

    关 键 词:
    一种 基于 数据 保存 存储 信息 统计 管理 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201410078821.7

    申请日:

    2014.03.06

    公开号:

    CN103795811A

    公开日:

    2014.05.14

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):H04L 29/08申请日:20140306|||公开
    IPC分类号: H04L29/08; G06F17/30 主分类号: H04L29/08
    申请人: 焦点科技股份有限公司
    发明人: 何学勇; 梁峰; 许诺
    地址: 210061 江苏省南京市高新区星火路软件大厦A座12楼
    优先权:
    专利代理机构: 南京知识律师事务所 32207 代理人: 张苏沛
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201410078821.7

    授权公告号:

    ||||||

    法律状态公告日:

    2015.05.06|||2014.06.11|||2014.05.14

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明公开了一种基于元数据保存存储信息及统计管理数据的方法,其特征在于,具体包括步骤如下:步骤一、客户端向存储服务器发送保存数据请求;步骤二、用户保存数据的请求到达服务器后,服务器将数据保存在数据仓储中,客户端根据待发送数据量大小将数据拆分为多个数据块,逐个发送到存储服务器;步骤三、服务器从数据中抽取出需要的统计信息与其基本信息组成元数据,并把元数据保存在元数据仓储中;步骤四、服务器返回保存数据成功信息到客户端。本专利通过对元数据中基本信息的处理,实现对存储数据的统计管理,并达到简化操作减少资源浪费的目标。

    权利要求书

    权利要求书
    1.  一种基于元数据保存存储信息及统计管理数据的方法,其特征在于,具体包括步骤如下:
    步骤一、客户端向存储服务器发送保存数据请求;
    步骤二、用户保存数据的请求到达服务器后,服务器将数据保存在数据仓储中,客户端根据待发送数据量大小将数据拆分为多个数据块,逐个发送到存储服务器;
    步骤三、服务器从数据中抽取出需要的统计信息与其基本信息组成元数据,并把元数据保存在元数据仓储中;
    步骤四、服务器返回保存数据成功信息到客户端。

    2.  根据权利要求1所述的基于元数据保存存储信息及统计管理数据的方法,其特征在于:步骤三中,元数据组成部分包括:partiton、database、table、key、blockIndex、lastblockflag、dataSize。

    3.  根据权利要求1所述的基于元数据保存存储信息及统计管理数据的方法,其特征在于:步骤二与步骤三属于一个原子操作。

    4.  根据权利要求1所述的基于元数据保存存储信息及统计管理数据的方法,其特征在于,步骤三的处理过程中包含两部分数据操作: 
    1) 为每个数据块创建一个块元数据(block meta)信息,保存在元数据仓储中;
    2) 为每条数据记录创建一个记录元数据(record meta),当上传新的该数据的数据块时,更新记录元数据(record meta)信息中保存的相关信息;
    保存时,以元数据字符串保存为B树结构;查找时,以前面的数据基本信息作为查找索引,能够方便快捷的找出需要的数据。

    5.  根据权利要求1至4之一所述的基于元数据保存存储信息及统计管理数据的方法,其特征在于,当用户需要进行数据统计时,不需要遍历保存在服务器的数据块而是仅需遍历元数据仓储即可,具体步骤为:
    步骤1:遍历元数据存储的B树结构,取出元数据对应的数据统计信息,进行统计计算,并返回计算的统计结果;
    步骤2:整个集群所有服务器的统计结果返回后,统一计算,进行分类统计,得到最终结果。

    6.  根据权利要求1至4之一所述的基于元数据保存存储信息及统计管理数据的方法,其特征在于,当需要扩展数据块相关的基本信息或统计信息时,不用修改数据块而是仅修改对应的元数据,具体步骤为:
    步骤1:当需要修改数据块相关的基本信息,比如添加一个保存时间,以方便以后按时间统计数据,并且可以得到某一类数据的增长趋势等需求时,修改每个数据对应的元数据即可;修改元数据的组成,在原来组成的基础上,即元数据包含信息:partiton、database、table、key、blockIndex、lastblockflag、dataSize中,添加一个保存时间time,如修改元数据为partiton、database、table、key、time、blockIndex、lastblockflag 、dataSize;步骤2:当需要查看添加时间时,只需要查找该元数据即可;由于修改不涉及到数据块的更改,所以不会影响该数据的正确性和有效性。

    7.  根据权利要求1至4之一所述的基于元数据保存存储信息及统计管理数据的方法,其特征在于,删除操作在一个原子操作下删除数据的同时删除其元数据,具体步骤为:
    步骤1:当用户发起删除数据操作时,请求到达服务器;
    步骤2:服务器在一个事务中同时做删除数据和其元数据操作;如果操作都成功则数据及元数据一起删除,如果其中一个操作失败,则事务回滚,删除操作撤销。

    8.  根据权利要求5所述的基于元数据保存存储信息及统计管理数据的方法,其特征在于:通过对元数据的统计,能够得知数据切分为多个数据块以及数据是否完备。

    9.  根据权利要求1所述的基于元数据保存存储信息及统计管理数据的方法,其特征在于:
        步骤五、用户需要统计每个项目的存储数据量,向存储服务器发送统计请求;
        步骤六、服务器接受到请求后,如果元数据不在内存,则将元数据放入内存,对内存中的元数据遍历其B树结构;
        步骤七、按项目进行分类,从而方便对每个项目的中包含的元数据进行统计处理,把元数据中保存的存储量数据进行归类计算;
        步骤八、计算完统计信息后,返回结果给客户端。

    说明书

    说明书一种基于元数据保存存储信息及统计管理数据的方法
    技术领域
           本发明属于存储技术领域,具体涉及一种基于元数据保存存储信息及统计管理数据的方法。
     
    背景技术
           随着现代IT系统的发展及公司业务的扩展,数据的规模越来越庞大,并且增速也越来越快,因此传统的数据库系统遇到了前所未有的挑战,并在以后有可能成为系统发展及业务扩展的瓶颈。目前,为了应对海量数据的存储和管理及控制、减少存储成本,已经有很多公司和组织开始使用数据存储。因此,数据存储在业界得到了越来越广泛的使用。
           在使用数据存储的时候,如果只提供单纯的数据存储和读取功能,那么对于所存储数据的统计和查询功能(各种类型数据所占空间容量、各种类型数据增加趋势等功能需求),就需要依次取出所有数据,进行分类计算,然后进行数据统计。这样每次都要把所有数据取出并进行计算,如果有2个TB的数据,那么每次计算都要遍历这2个TB的数据,并对这些数据进行计算,将会导致算法复杂度的提升及系统资源浪费。
    于是人们提出了元数据(描述数据及其环境的数据)的概念,在保存数据的同时统计好该数据的相关信息,并放入元数据中,当需要统计信息时,只需要取出这些元数据进行计算而不是整个数据进行计算,这样就简化了算法并节约成本。这时候元数据应该放在那里?如何放?就成了需要解决的问题。
           在数据存储领域,专利“一种适用于云存储系统的元数据分布式存储方法”(申请号:201210236195.0)提出的方法主要为:将数据和元数据组成混合数据块保存在数据存储上,使得元数据及数据块混合存储,并具备与数据块有相同的冗余度。
    该方法存在如下问题:1、当需要对元数据进行扩展时,由于元数据借用了数据块的地址,附加在数据块后面,需要修改数据和元数据的混合数据块,如果修改错误,则会造成整条数据不可用;2、不支持大数据(数据量很大,需要拆分为多个数据块),即一条记录多个数据块的情况。
           
    发明内容
    为了解决存储领域中对于元数据的存储所带来的以上两个问题,本专利提供了一种基于元数据保存存储信息及统计管理数据的方法,通过对元数据中基本信息的处理,实现对存储数据的统计管理,并达到简化操作减少资源浪费的目标。
    本专利提供的具体技术方案如下:一种基于元数据保存存储信息及统计管理数据的方法,包括具体步骤如下:
    步骤1:客户端向存储服务器发送保存数据请求;
    步骤2:用户保存数据的请求到达服务器后,服务器将数据保存在数据仓储中。
    如果待发送数据量很大,客户端会将大数据拆分为多个数据块,逐个发送到存储服务器,其中,此处设置了4种数据块大小的标准:1M、2M、3M、5M,根据传递数据的不同,选择相应的数据块大小的标准。
    步骤3:服务器从数据中抽取出需要的统计信息(如:数据大?。┯肫浠拘畔ⅲㄈ纾河没淙氲膋ey、上传图片的应用的database、图片所在的表标识等)组成元数据,并把元数据保存在元数据仓储中。元数据组成部分包括:partiton、database、table、key、blockIndex、lastblockflag、dataSize。步骤2与步骤3属于一个原子操作;
    其中,在本处理过程中包含2部分数据操作: 
    1) 为每个数据块创建一个块元数据(block meta)信息,保存在元数据仓储中。
    2) 为每条数据记录创建一个记录元数据(record meta),当上传新的该数据的数据块时,更新record meta信息中保存的相关信息。
    保存时,以元数据字符串保存为B树结构。在查找时,以前面的数据基本信息作为查找索引,可以方便快捷的找出需要的数据。其中,B树结构是一种适用于外查找的树,它是一种平衡的多叉树,称为B树(或B-树、B_树)。
    步骤4:服务器返回保存数据成功信息到客户端。
    当用户需要进行数据统计时,不再需要遍历保存在服务器的数据块而是遍历元数据仓储就可以解决问题;具体过程如下:
    步骤1:遍历元数据存储的B树结构,取出元数据对应的数据统计信息,进行统计计算,并返回计算的统计结果
    步骤2:整个集群所有服务器的统计结果返回后,统一计算,进行分类统计,得到最终结果。
    当需要扩展数据块相关的基本信息或统计信息时,可以不用修改数据块而是修改对应的元数据,这样就减小了修改错误对于原数据的影响。具体过程如下:
    步骤1:当需要修改数据块相关的基本信息,比如添加一个保存时间,以方便以后按时间统计数据,并且可以得到某一类数据的增长趋势等需求时,修改每个数据对应的元数据即可。修改元数据的组成,在原来组成的基础上,即元数据包含信息:partiton、database、table、key、blockIndex、lastblockflag、dataSize中,添加一个保存时间time,如修改元数据为partiton、database、table、key、time、blockIndex、lastblockflag 、dataSize。
    步骤2:当需要查看添加时间时,只需要查找该元数据即可。由于修改不涉及到数据块的更改,所以不会影响该数据的正确性和有效性。
    删除操作在一个原子操作下删除数据的同时删除其元数据。具体过程如下:
    步骤1:当用户发起删除数据操作时,请求到达服务器。
    步骤2:服务器在一个事务中同时做删除数据和其元数据操作。如果操作都成功则数据及元数据一起删除,如果其中一个操作失败,则事务回滚,删除操作撤销。 
    通过对元数据的统计,可以得知数据切分为多个数据块以及数据是否完备。
           本发明与现有技术相比,其显著优点:
    1)        通过遍历某个数据服务器的元数据database,可以很方便的取得该服务器的存储统计信息,减少了系统复杂度及资源浪费;
    2)        当需要对数据块的基本信息修改时,只需要修改对应的元数据就可以达到目标,减少了可能出错的概率;
    3)        使用B树形结构,在数据迁移时,如果需要把某个分片迁移到集群中另一个存储上时,可以直接将该分片的子树整个迁移过去,达到方便数据迁移的目的;
    4)        不需要专门的元数据服务器,因此运行可靠并且降低了服务器成本;
    5)        元数据保存在数据集群中,方便以后的扩展。
     
    附图说明
           图1 为本发明数据块和块元数据(block meta)在同一数据服务器上的存储策略。
           图2 为本发明数据和记录元数据(record meta)在同一数据服务器上的存储策略。
           图3 为本发明元数据写入过程流程图。
           图4 为本发明元数据统计读取过程图。
    图5 为本发明数据块存储结构图。
    图6 为本发明元数据存储结构图。
     
    具体实施方式
           为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
    术语解释
    数据仓储:依照某种数据模型,组织并存放数据的集合。
    元数据仓储:依照某种数据模型,组织并存放元数据的集合。
    原子操作:指的是这个操作所处层的更高层不能发现其内部实现与结构。其不会被线程调度机制打断的操作;这种操作一旦开始,就一直运行到结束,中间不会有任何 context switch (切换到另一个线程)。
    如图1所示,为本发明的数据块存储策略。数据块及其元数据存储在一个数据服务器的不同仓储上,使得元数据与数据块有着相同的冗余度与扩展性。
    如图2所示,为本发明的数据存储策略。为每条用户上传的完整数据记录单独创建保存一个元数据(record meta),用于记录该数据记录的统计信息。一个完整的数据记录保存在一个存储服务器上,当数据量很大时,可以认为存储集群数据是均匀分布的。
    如图1与2所示,一个数据记录对应一个数据记录元数据(record meta),一个数据记录可能会拆分为多个数据块,每个数据块对应一个块元数据(block meta);数据保存在数据仓储中,元数据(包括记录元数据和块元数据)保存在元数据仓储中。
    图3示出了本发明实例提供的数据存储方法实现流程,具体如下:
    步骤1:假设客户端上传项目project1所属表table1的数据,key为key1??突Ф讼虼娲⒎衿鞣⑺捅4媸萸肭?。
    如果数据较大,则拆分为多个数据块,逐个发送;其中,此处设置了4种数据块大小的标准:1M、2M、3M、5M,根据传递数据的不同,选择相应的数据块大小的标准,例如发送图标数据时,因为图标数据普遍较小,就选择1M的数据块的标准;如果发送flash格式的文件时,因为这类文件一般来说比较大,那么可以适当选择3M的数据块标准;如果发送视频文件时,而视频文件的大小比flash文件一般更大,就适当选择5M的数据块标准。
    步骤2:用户保存数据的请求到达服务器后,服务器将数据以B树的存储结构保存在数据仓储中,方便以后的数据查找;
    步骤3:服务器从数据块中抽取出需要的统计信息与其基本信息组成元数据为partiton、database、table、key、time、blockIndex、lastblockflag、dataSize,并把元数据也以B树的存储结构保存在元数据仓储中,步骤2与步骤3属于一个原子操作。
    其中,在本处理过程中包含两部分数据操作: 
    1)      为每个数据块创建一个块元数据(block meta)信息(具体包含:1、元数据的基本信息;2、数据dataSize),保存在元数据仓储中,具体参见图1。
    2)      为每条数据创建一个记录元数据(record meta)(具体包含:1、元数据基本信息;2元数据对应数据的统计信息),当上传新的该数据的数据块时,更新record meta信息中保存的相关信息,具体参见图2。
    步骤4:服务器返回保存的结果到客户端。
    图4示出了本发明统计一个数据服务器的存储信息流程图。其流程包括以下步骤:
           步骤1:假设用户需要统计每个项目的存储数据量,向存储服务器发送统计请求。
           步骤2:服务器接受到请求后,如果元数据不在内存,则将元数据放入内存,对内存中的元数据遍历其B树结构。
           步骤3:按项目进行分类,从而方便对每个项目的中包含的元数据进行统计处理,把元数据中保存的存储量数据进行归类计算。
           步骤4:计算完统计信息后,返回结果给客户端。
    如图5所示,为本发明的数据块存储结构。数据块按照B树存储结构保存在数据仓储中,在数据查找时,可以根据保存数据的信息按顺序对B树进行遍历,比如通过key计算出数据属于哪个分片,找到对应分片的partiton节点,然后继续通过数据属于哪个project、table、key找到对应叶子节点的数据Block,从而很容易的到需要的数据。
    按图5所示的树形结构,在数据迁移时,如果需要把某个分片迁移到集群中另一个存储上时,可以直接将该partition子树整个迁移过去,达到方便数据迁移的目的。
    如图6所示,为本发明的元数据存储结构。元数据按照B树存储结构保存在元数据仓储中。在数据查找时,可以通过 B树很容易的找到需要的元数据。查找同图5所述,当找到对应的元数据信息后,可以通过计算所找到的元数据相关信息,例如统计数据量大小、存储时间等,得到需要的统计信息,比如计算key1数据的总数据量,可以将key1下所有叶子节点的元数据中的数据量信息进行累加,从而得到该key1总数据量。
    如果不使用元数据,那么每次都需要取出该数据的所有的数据进行计算,这样将浪费大量的系统资源。
    以上所述仅为本发明专利的一种实施例而已,并不用以限制本发明专利,凡在本发明专利的精神和原则之内所作的任何修改、等同替换和改进等,均以包含在本发明专利的?;し段е?。    内容来自专利网重庆时时彩单双窍门 www.4mum.com.cn转载请标明出处

    关于本文
    本文标题:一种基于元数据保存存储信息及统计管理数据的方法.pdf
    链接地址://www.4mum.com.cn/p-6156641.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 浪潮孙丕恕从信息时代到智能时代 人工智能价值将爆发式释放 2019-12-21
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 网球比分1234 今日山西快乐10分走势 上海晓游棋牌大厅下载 半全场心得 20选5 手机微信麻将开挂软件 牛b的赚钱方法 快乐十分多少钱一注 3d组选5码遗漏 山东群英会开奖直播 网球吧百度贴吧 极速时时彩上必发彩票 体彩6+1 陕西快乐十分前三组遗漏数据查询 双色球app 今天浙江11选5开奖结果查询结果