• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 15
    • 下载费用:30 金币  

    重庆时时彩高手直播: 一种数据处理方法和装置.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201410004770.3

    申请日:

    2014.01.06

    公开号:

    CN104765651A

    公开日:

    2015.07.08

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06F 11/14申请日:20140106|||公开
    IPC分类号: G06F11/14 主分类号: G06F11/14
    申请人: 中国移动通信集团福建有限公司
    发明人: 陈欻; 阮前; 张健; 叶荣光
    地址: 350003福建省福州市鼓楼区湖东路140号
    优先权:
    专利代理机构: 北京派特恩知识产权代理有限公司11270 代理人: 任媛; 蒋雅洁
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201410004770.3

    授权公告号:

    ||||||

    法律状态公告日:

    2019.02.26|||2015.08.05|||2015.07.08

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明公开了一种数据处理方法和装置,其中,一种数据处理方法包括:根据收到的备份指令,获取预先配置的备份策略;根据所述备份策略将数据存储到至少一个存储节点。另一种数据处理方法包括:根据收到的恢复指令,获取预先配置的恢复策略;根据预先配置的恢复策略进行数据的恢复。

    权利要求书

    权利要求书
    1.  一种数据处理方法,其特征在于,所述方法包括:
    根据收到的备份指令,获取预先配置的备份策略;
    根据所述备份策略将数据存储到至少一个存储节点。

    2.  根据权利要求1所述的方法,其特征在于,所述方法还包括:
    记录并显示备份进度信息。

    3.  根据权利要求1所述的方法,其特征在于,所述方法还包括:
    生成备份数据的索引。

    4.  一种数据处理方法,其特征在于,所述方法包括:
    根据收到的恢复指令,获取预先配置的恢复策略;
    根据预先配置的恢复策略进行数据的恢复。

    5.  根据权利要求1所述的方法,其特征在于,所述获取预先配置的恢复策略之前,所述方法还包括:
    获取备份数据的索引;
    根据所述备份数据的索引在相应的存储节点查询恢复指令对应的数据,当查询到对应的数据时,执行获取预先配置的恢复策略的步骤。

    6.  一种数据处理装置,其特征在于,所述装置包括:
    第一获取单元,用于根据收到的备份指令,获取预先配置的备份策略;
    第一控制单元,用于根据所述备份策略将数据存储到至少一个存储节点。

    7.  根据权利要求6所述的装置,其特征在于,所述装置还包括:
    记录单元,用于记录并显示备份进度信息。

    8.  根据权利要求6所述的装置,其特征在于,所述装置还包括:
    生成单元,用于记录并显示备份进度信息。

    9.  一种数据处理装置,其特征在于,所述装置包括:
    第二获取单元,用于根据收到的恢复指令,获取预先配置的恢复策略;
    第二控制单元,用于根据预先配置的恢复策略进行数据的恢复。

    10.  根据权利要求9所述的装置,其特征在于,所述装置还包括:
    第三获取单元,用于根据收到的恢复指令,获取备份数据的索引;
    查询单元,用于根据所述备份数据的索引在相应的存储节点查询恢复指令对应的数据,当查询到对应的数据时,通知第二获取单元执行获取预先配置的恢复策略的操作。

    说明书

    说明书一种数据处理方法和装置
    技术领域
    本发明涉及通信技术,尤其涉及一种数据处理方法和装置。
    背景技术
    移动业务运营支撑系统(Business&Operation Support System,BOSS)的帐详单系统已建成多年,承担着原始话单批价处理、账单生成、账详单查询等基础功能,并为统计分析、收入保障提供数据来源。随着用户量和业务量日益增长,现有帐详单系统在前台查询性能、后台运维管理等方面逐渐达到瓶颈,难以满足业务发展需要。
    针对帐详单的海量数据引起的存储空间小、查询性能差、统计分析瓶颈、文件库修改困难等问题,目前引入基于列模式、适合于海量数据存储的Hadoop分布式数据库(Hadoop Database,HBase)以及旨在为数据仓库和大规模分析处理功能提供技术支持的分析型数据库Greenplum,以此来全面提升系统架构,得到新的云计算架构。
    在新的云计算架构以下,数据同样需要备份和恢复处理。在BOSS帐详单系统的云方案中分布式数据库Hbase存储着海量的详单数据,现有的基本可行的基于Hbase的数据处理技术包括:利用Hbase的导出(Export)工具进行数据的备份,利用导入(Import)工具进行数据的恢复。
    数据处理的步骤,如图1所示,包括:
    1、备份数据时,利用Export工具将Hbase中的指定范围的数据,以表为粒度导出成Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)中的文件;
    2、将HDFS中的文件备份到远端的备份存储中进行保存;
    3、数据恢复时,先从远端备份存储中将数据恢复到HDFS中;
    4、利用Import工具将HDFS中的文件加载到Hbase中。
    虽然现有技术可以进行数据的备份和恢复处理。但是,当每天新的数据量很大,且留有的备份时间窗口很小时,现有技术无法在很小的备份窗口及时完成备份数据,无法记录在某一个时刻用户对数据的操作历史,无法保证多表间数据在某一时刻的关联,也无法在备份出的海量数据中快速的找到要恢复的数据并进行数据的恢复,由此现有技术不能满足数据处理的需求。
    发明内容
    为解决现有存在的技术问题,本发明实施例提供一种数据处理方法和装置。
    本发明提供一种数据处理方法,所述方法包括:
    根据收到的备份指令,获取预先配置的备份策略;
    根据所述备份策略将数据存储到至少一个存储节点。
    本发明提供一种数据处理方法,所述方法包括:
    根据收到的恢复指令,获取预先配置的恢复策略;
    根据预先配置的恢复策略进行数据的恢复。
    本发明提供另一种数据处理装置,所述装置包括:
    第一获取单元,用于根据收到的备份指令,获取预先配置的备份策略;
    第一控制单元,用于根据所述备份策略将数据存储到至少一个存储节点。
    本发明提供另一种数据处理装置,所述装置包括:
    第二获取单元,用于根据收到的恢复指令,获取预先配置的恢复策略;
    第二控制单元,用于根据预先配置的恢复策略进行数据的恢复。
    由上可知,本发明的技术方案包括:根据收到的备份指令,获取预先配置的备份策略;根据所述备份策略将数据存储到至少一个存储节点。由此,本发明能够在备份窗口内及时完成数据备份。
    附图说明
    图1为现有技术实现数据处理的示意图;
    图2为本发明一种数据处理方法的第一实施例的流程示意图;
    图3为本发明一种数据处理方法的第二实施例的流程示意图;
    图4为本发明一种数据处理方法的第三实施例的流程示意图;
    图5为本发明另一种数据处理方法的第一实施例的流程示意图;
    图6为本发明另一种数据处理方法的第二实施例的流程示意图;
    图7为本发明一种数据处理装置的实施例的流程示意图;
    图8为本发明另一种数据处理装置的实施例的流程示意图;
    图9为本发明实施例提供的实现数据处理方法的系统的结构示意图;
    图10为本发明实施例提供的备份流程图;
    图11为本发明实施例提供的恢复流程图。
    具体实施方式
    本发明提供的一种数据处理方法的第一实施例,如图2所示,所述方法包括:
    步骤201、根据收到的备份指令,获取预先配置的备份策略;
    步骤202、根据所述备份策略将数据存储到至少一个存储节点。
    这里,可以通过控制备份代理来进行多点协同备份,以将数据存储到至少一个存储节点。所述备份代理的数量至少为一个,多个备份代理服务运行在并行计算框架之上。这样,可以有效地提高备份的并行性,同时可以保证任务执行的可靠性。
    所述备份代理可以安装在Hbase RegionServer节点上,所述备份代理需要安装Hbase客户端(client)软件。这样,可以利用数据本地化的特性来尽量减少网络通信,提高备份性能。备份代理也可以称为备份代理节点。
    在实际应用中,可以提供一个图形界面供备份管理人员进行备份策略的定制。
    具体的,所述备份策略可以包括:

    本发明提供的一种数据处理方法的第二实施例,如图3所示,所述方法包括:
    步骤301、根据收到的备份指令,获取预先配置的备份策略;
    步骤302、根据所述备份策略将数据存储到至少一个存储节点。
    步骤303、记录并显示备份进度信息。
    这里,可以通过提供一个图形界面显示备份进度信息。所述备份进度信息纪录了备份任务的进度。
    本发明提供的一种数据处理方法的第三实施例,如图4所示,所述方法包括:
    步骤401、根据收到的备份指令,获取预先配置的备份策略;
    步骤402、根据所述备份策略将数据存储到至少一个存储节点。
    步骤403、生成备份数据的索引。
    这里,所述备份数据的索引用于记录备份数据所存储的位置,供恢复时快速定位备份数据。
    本发明提供的一种数据处理方法的第一实施例,如图5所示,所述方法包括:
    步骤501、根据收到的恢复指令,获取预先配置的恢复策略;
    步骤502、根据预先配置的恢复策略进行数据的恢复。
    这里,可以通过控制恢复代理来进行数据的恢复。所述恢复代理可以安装在Hbase RegionServer节点上,所述恢复代理需要安装Hbase client软件?;指创硪部梢猿莆指创斫诘?。
    在实际应用中,可以提供一个图形界面供备份管理人员进行恢复策略的定制。
    具体的,所述恢复策略可以包括:

    本发明提供的一种数据处理方法的第二实施例,如图6所示,所述方法包 括:
    步骤601、根据收到的恢复指令,获取备份数据的索引;
    步骤602、根据所述备份数据的索引在相应的存储节点查询恢复指令对应的数据,当查询到对应的数据时,进入步骤603;当查询不到对应的数据时,进入步骤605;
    步骤603,获取预先配置的恢复策略;
    步骤604、根据预先配置的恢复策略进行数据的恢复,结束本次流程。
    步骤605、报告数据异常。
    本发明提供的一种数据处理装置的实施例,如图7所示,所述装置包括:
    第一获取单元701,用于根据收到的备份指令,获取预先配置的备份策略;
    第一控制单元702,用于根据所述备份策略将数据存储到至少一个存储节点。
    较佳地,所述装置还包括:
    记录单元703,用于记录并显示备份进度信息。
    较佳地,所述装置还包括:
    生成单元704,用于记录并显示备份进度信息。
    本实施例中的数据处理装置对应于下文的控制子系统、控制节点。
    本发明提供的另一种数据处理装置的实施例,如图8所示,所述装置包括:
    第二获取单元801,用于根据收到的恢复指令,获取预先配置的恢复策略;
    第二控制单元802,用于根据预先配置的恢复策略进行数据的恢复。
    较佳地,所述装置还包括:
    第三获取单元803,用于根据收到的恢复指令,获取备份数据的索引;
    查询单元804,用于根据所述备份数据的索引在相应的存储节点查询恢复指令对应的数据,当查询到对应的数据时,通知第二获取单元执行获取预先配置的恢复策略的操作。
    本实施例中的数据处理装置可以对应于下文的控制子系统、控制节点。
    在实际应用中,可以将备份数据用的数据处理装置和恢复数据用的数据处 理装置设置在一个控制节点上。
    下面结合附图和具体实施对本发明的技术方案进一步详细阐述。
    本发明提供的一种数据处理方法可以通过图9所示的系统实现,所述系统包括控制子系统901、备份子系统902、恢复子系统903、存储子系统904、生产子系统905、备份数据恢复子系统906。
    控制子系统901:提供一个图形界面供备份管理人员进行备份策略和恢复策略的定制;显示备份进度记录;控制备份代理以及恢复代理工作的开始和停止??刂谱酉低骋部梢猿莆刂平诘?。
    备份子系统902:执行具体的备份任务,多个备份代理服务运行在并行计算框架之上。这样,可以有效地提高备份的并行性,同时可以保证任务执行的可靠性。所述备份代理可以安装在Hbase RegionServer节点上,所述备份代理需要安装Hbase client软件。这样,可以利用数据本地化的特性来尽量减少网络通信,提高备份性能。
    恢复子系统903:执行具体的数据恢复任务,多个恢复代理服务运行在并行计算框架之上。这样,可以有效地提高恢复数据的并行性,同时可以保证任务执行的可靠性。所述恢复代理可以安装在Hbase RegionServer节点上,所述恢复代理需要安装Hbase client软件。这样,可以利用数据本地化的特性来尽量减少网络通信,提高备份性能。
    存储子系统904:包括多个备份数据存储节点,用于存储海量的备份数据;提供备份数据索引节点,供恢复时快速定位备份数据。
    生产子系统905:对外提供应用服务,同时为了数据的安全性需要进行数据的备份。
    备份数据恢复子系统906:用于备份数据的恢复,数据恢复后可对外提供数据的访问。
    如图10所示,在本发明中数据备份流程如下:
    1001、管理人员通过控制节点定义备份策略。
    假定备份策略为:
    备份目标:table1,table2;
    备份的时间段及开始时间:每天0点开始备份,备份窗口6个小时;
    参与备份的节点,备份/恢复代理1、备份/恢复代理2、备份/恢复代理3;
    备份方式:增量备份;
    备份数据的组织方式:以主键组织数据。
    1002、控制子系统生成备份策略。
    1003、控制子系统获取到备份策略后,循环判断当前的时间是否是0点,如果不是0点,重复步骤1003;如果是0点,进入步骤1004。
    1004、控制子系统则会启动备份代理1、备份代理2、备份代理3,并将备份策略告知备份代理。
    1005、备份代理1、备份代理2、备份代理3开始对table1和table2中第一个未备份半小时数据进行并行的备份工作。
    1006、判断第一个半小时的数据备份是否完成,当没有完成时,进入步骤1005;当完成时,备份代理将数据存储到存储子系统中,同时将备份的进度存储到控制子系统中,除了存储数据以外,还需生成备份数据的索引。进入步骤1007;
    1007、控制子系统根据备份上一个半小时数据的时间看剩余的备份窗口是否满足下一个半小时的备份。当满足时,进入步骤1008;当不满足时,进入步骤10
    1008、启动接下来半小时数据的备份,数据备份成功后同样要写入存储子系统,并将备份的进度存储到控制子系统中,除了存储数据以外,还需生成备份数据的索引。返回步骤1007,重复步骤1007~1008,直到备份窗口用完,则停止备份代理1、备份代理2、备份代理3的工作。
    如图11所示,在本发明中数据恢复流程如下:
    1101、管理人员通过控制节点定义恢复策略。
    假定恢复策略为:
    参与恢复的节点:备份/恢复代理1、备份/恢复代理2、备份/恢复代理3;
    恢复的时间段、数据和位置:恢复2013/8/1117:30~18:00,table1和table2的数据,恢复到备份数据恢复系统中;
    保留的副本数:3。
    1102、控制节点生成恢复策略。
    1103、控制节点生成恢复策略后立即启动恢复代理1、恢复代理2、恢复代理3,并将恢复策略传递给恢复代理。
    1104、恢复代理接收到恢复命令后,开始进行并行的数据恢复工作。
    1105、数据恢复工作首先到存储子系统的备份数据节点查询要恢复的数据是否存在,当存在时,进入步骤1106;当不存在时,进入步骤1108。
    1106、将相应的数据恢复到备份数据恢复系统中;
    1107、在数据恢复完成后,停止恢复代理1、恢复代理2、恢复代理3的工作,结束本次流程。
    1108、向管理员报告数据异常。
    本发明通过控制节点,以图形化的方式实现备份与恢复策略的定制、能够干预备份和恢复代理节点的运作、并且在备份的过程中能记录备份的进度以及断点。
    本发明的备份和恢复代理节点,可以根据相应的配置策略进行海量数据的备份与恢复操作、并且可以根据需要自行选择全部或是部分节点参与、基于运行在MapReduce(MR)框架上的并行代理节点实现高效且可靠的备份与恢复工作。
    本发明的备份和恢复代理节点,可以灵活选择备份的KEY字段、并且可以灵活选择备份时间点以及时间窗、并能在备份时实时统计每次备份所需要的时间,同时根据此统计时间和备份窗口来决定是否进行下一个时间段的增量备份。
    本发明备份和恢复代理节点,可以按时间段、数据和位置、历史操作版本进行数据恢复操作;优先恢复时间最早的数据;并且在恢复时的rowkey上增加字符串的方式保证纪录的唯一性。
    综上所述,本发明弥补了Hbase数据库架构下,单表频繁更新时无法实现 增量备份、并发备份需手工协调,造成管理难度增大、业务限制造成海量数据的备份时间窗相对较小等不足。本发明的技术效果包括:可通过备份控制节点预先配置备份策略、恢复策略;备份数据、时间可灵活选择,备份时间窗可实时估算,可以任意选择历史操作数据进行恢复;通过备份/恢复代理进行多点协同备份与恢复。本发明可以实现高效可靠的全量与增量海量数据备份能力;可以最大化降低备份对业务连续性的影响;可以最大化减少备份过程的人工干预,降低运维管理工作量。
    本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
    本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合??商峁┱庑┘扑慊绦蛑噶畹酵ㄓ眉扑慊?、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
    这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
    这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
    以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的?;し段?。

    关 键 词:
    一种 数据处理 方法 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:一种数据处理方法和装置.pdf
    链接地址://www.4mum.com.cn/p-5894857.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03