• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 14
    • 下载费用:30 金币  

    重庆时时彩龙虎和规律: 受控的数据中心服务的自动复原.pdf

    关 键 词:
    受控 数据中心 服务 自动 复原
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201110285713.3

    申请日:

    2011.09.09

    公开号:

    CN102385541A

    公开日:

    2012.03.21

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||专利申请权的转移IPC(主分类):G06F 11/14变更事项:申请人变更前权利人:微软公司变更后权利人:微软技术许可有限责任公司变更事项:地址变更前权利人:美国华盛顿州变更后权利人:美国华盛顿州登记生效日:20150728|||实质审查的生效IPC(主分类):G06F 11/14申请日:20110909|||公开
    IPC分类号: G06F11/14; G06F9/48 主分类号: G06F11/14
    申请人: 微软公司
    发明人: P·A·杜尔诺夫; 徐海智
    地址: 美国华盛顿州
    优先权: 2010.09.10 US 12/879,412
    专利代理机构: 上海专利商标事务所有限公司 31100 代理人: 罗婷婷
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201110285713.3

    授权公告号:

    |||||||||

    法律状态公告日:

    2016.08.03|||2015.08.19|||2012.05.02|||2012.03.21

    法律状态类型:

    授权|||专利申请权、专利权的转移|||实质审查的生效|||公开

    摘要

    本发明涉及受控的数据中心服务的自动复原。在此描述的主题旨在将应用程序组件从有故障数据中心资源处重分配至无故障数据中心资源处。后台监控器标识有故障的数据中心资源,并调度对应用程序组件的从有故障数据中心资源到无故障数据中心资源的迁移。以允许应用程序保持可用的自动方式来执行迁移。阈值适于控制迁移率以及检测何时会因数据中心范围内的处理或应用程序故障而造成资源故障。

    权利要求书

    1.一种将应用程序组件(226)从有故障数据中心资源(216)处重分配至
    无故障数据中心资源(220)处的方法,该方法包括:
    标识(312)其上部署了所述应用程序组件(226)的有故障数据中心资源
    (216);
    生成(314)指示要将所述应用程序组件从所述有故障数据中心资源处转
    移走的服务复原任务(260);
    执行(316)使用所述服务复原任务并标识所述无故障数据中心资源(220)
    可用来接收所述应用程序组件的组件重分配后台监控器(270);
    生成(318)指示要将所述应用程序组件转移至所述无故障数据中心资源
    处的滚动升级任务(272),以及;
    执行(320)使用所述滚动升级任务并将所述应用程序组件重分配至所述
    无故障数据中心资源处的滚动升级后台监控器(278)。
    2.如权利要求1所述的方法,其特征在于,
    其中所述应用程序组件是一组应用程序组件中的一个组件,以及
    其中,在两个或更多虚拟分组中划分所述组,使得所述应用程序组件在一
    个虚拟分组内,且所述组中的另一应用程序组件在另一虚拟分组内。
    3.如权利要求2所述的方法,其特征在于,
    其中,将所述一个虚拟分组和所述其他虚拟分组分配到各自的有故障数据
    中心资源上,并且
    其中,根据所述滚动升级任务来启动对所述应用程序组件的重分配是以完
    成对在所述其他虚拟分组中的所述其他应用程序组件的重分配为条件的。
    4.如权利要求1所述的方法,其特征在于,为了标识所述无故障数据中心
    资源,所述组件重分配后台监控器参考由联网计算机资源控制器来维护的资源
    清单。
    5.如权利要求1所述的方法,其特征在于,
    其中,将所述有故障数据中心资源包括在多个数据中心资源的网络中,
    其中,在标识所述有故障数据中心资源之前,标识所述多个中的一部分包
    括有故障数据中心资源,以及
    其中,当所述部分超过阈值部分时,并不生成所述服务复原任务。
    6.如权利要求1所述的方法,其特征在于,
    其中,维护一历史,该历史包括在给定时间段内重分配所述应用程序组件
    的场合的数目,以及
    其中,当所述数目超过阈值数目时,并不生成所述服务复原任务。
    7.一种在一个或多个计算机可读介质上实现的系统,该系统将应用程序组
    件(226)从有故障数据中心资源处(216)重分配至无故障数据中心资源(220)
    处,所述系统包括:
    标识所述有故障数据中心资源(216)的资源状态后台监控器(256),
    (a)其中,将应用程序的应用程序组件(226)部署在所述有故障数据
    中心资源上,以及
    (b)其中,所述资源状态后台监控器生成一服务复原任务(260),该
    服务复原任务包括从所述有故障数据中心资源处对所述应用程序组件进
    行重分配的指令;
    接收所述服务复原任务并标识所述无故障数据中心资源(220)可用来接
    收所述应用程序组件的组件重分配后台监控器(270),其中所述组件重分配
    后台监控器生成一升级任务(272),该升级任务包括将所述应用程序组件迁
    移至所述无故障数据中心资源处的指令;以及
    接收所述升级任务并转移所述应用程序组件的滚动升级后台监控器
    (278)。
    8.如权利要求7所述的系统,其特征在于,还包括在一组数据中心资源中
    确定有故障的数据中心资源的比率的依赖于分组健康的禁用器,其中在所述比
    率超过阈值比率时,禁用所述资源状态后台监控器。
    9.如权利要求7所述的系统,其特征在于,还包括,跟踪在给定时间段内
    复原所述应用程序的次数的依赖于应用程序复原率的禁用器,其中在该次数超
    过每应用程序复原频率阈值时,禁用旨在复原所述应用程序的操作。
    10.如权利要求7所述的系统,其特征在于,还包括,跟踪在给定时间段
    内复原所述应用程序组件的次数的依赖于组件复原率的禁用器,其中在该次数
    超过每组件复原频率阈值时,禁用旨在复原所述应用程序的操作。
    11.如权利要求7所述的系统,其特征在于,还包括控制如下各项的每会
    话扼制器:允许所述资源状态后台监控器在单个重分配会话中进行处理的应用
    程序组件的数目、允许所述组件重分配后台监控器在单个重分配会话中进行处
    理的应用程序组件的数目、允许升级后台监控器在单个重分配会话中进行处理
    的应用程序组件的数目、或其组合。
    12.其上包含计算机可执行指令的一个或多个计算机可读介质,在执行所
    述计算机可执行指令时,便于实现一种将应用程序组件(226)从有故障数据
    中心资源(216)处重分配至无故障数据中心资源(220)处的方法,所述方法
    包括:
    在一组数据中心资源中确定(412)包括有故障数据中心资源的所述组的
    一部分(216和218);
    将所述部分与分组健康阈值进行比较(414);
    在所述部分低于所述分组健康阈值时,标识(416)其上部署了所述应用
    程序组件的所述有故障数据中心资源,其中所述应用程序组件在给定时间段内
    已被重分配了一定的次数;
    将所述次数与另一阈值进行比较(418);以及
    在所述数量低于所述其他阈值时,将所述应用程序组件从所述有故障数据
    中心资源处重分配(420)至所述无故障数据中心资源处。
    13.如权利要求12所述的计算机可读介质,其特征在于,所述其他阈值包
    括应用程序复原率阈值、组件复原率阈值或其结合。
    14.如权利要求12所述的计算机可读介质,其特征在于,
    其中所述应用程序组件是一组应用程序组件中的一个组件,以及
    其中,在两个或更多虚拟分组之间划分所述组,使得所述应用程序组件在
    一个虚拟分组内,且所述组中的另一应用程序组件在另一虚拟分组内。
    15.如权利要求14所述的计算机可读介质,其特征在于,
    其中,将所述一个虚拟分组和所述其他虚拟分组分配到各自的有故障数据
    中心资源上,以及
    其中,重分配所述应用程序组件是以完成对在所述其他虚拟分组中的所述
    其他应用程序组件的重分配为条件的。

    说明书

    受控的数据中心服务的自动复原

    技术领域

    本发明涉及复原数据中心服务的方法和系统。

    背景技术

    有时被称为云的数据中心由联网计算机资源(例如,服务器、盘、虚拟机等)
    组成,这些联网计算机资源被利用来部署所主存的应用程序。通过这样做,分
    布式应用程序可实现比底层硬件的可用性更高的可用性级别。即,有时底层硬
    件可能在将应用程序指派给了资源并且该应用程序正在利用这些资源的时候
    进入有故障状态(例如,调查或修复)。因此,具有适于将应用程序从有故障
    资源处重分配至无故障资源处,以便允许该应用程序保持可用性的措施是有帮
    助的。而且,即使在转移期间,以允许应用程序保持可用性的方式来重分配该
    应用程序也是有帮助的。

    发明内容

    本发明的各实施例由下面的权利要求书进行定义,而不由本概述进行定
    义。为此,此处提供了在此描述的主题的高级概览,以提供公开内容的概览,
    并介绍将在以下具体实施方式部分中进一步描述的一些概念。本概述不旨在标
    识所要求?;さ闹魈獾墓丶卣骰虮匾卣?,也不旨在用于帮助确定所要求保
    护的主题的范围。

    在此描述的主题旨在将应用程序组件从有故障数据中心资源处重分配至
    无故障数据中心资源处。后台监控器标识有故障的数据中心资源,并调度对应
    用程序组件的从有故障数据中心资源到无故障数据中心资源的迁移。以允许应
    用程序保持可用的自动方式来执行迁移。阈值适于控制迁移率以及检测何时会
    因数据中心范围内的处理或应用程序故障而造成资源故障。

    附图说明

    下面将参考附图详细描述本发明的说明性实施例,在附图中:

    图1是描绘了适于根据本发明的各实施方式来使用的示例性计算设备的框
    图;

    图2是根据本发明的实施例的示例性操作环境的框图;以及

    图3和4是根据本发明的实施例的示例性流程图。

    具体实施方式

    此处用具体细节来描述本发明以满足法定要求。然而,该说明书本身并非
    旨在必定限制权利要求的范围。相反,所要求?;さ闹魈饪山岷掀渌鼻盎蛭?br />来技术按照其它方式来具体化,以包括不同的步骤或类似于本文中所描述的步
    骤的步骤组合。术语不应被解释为暗示本文所公开的各步骤之中或之间的任何
    特定次序,除非且除了在明确描述个别步骤的次序的时候。

    一般而言,本发明的实施例旨在将应用程序组件从有故障数据中心资源处
    重分配至无故障数据中心资源处。正如此处所使用的,“应用程序组件”描述
    了部署在数据中心资源上的应用程序的至少一部分,并与一个或多个其他应用
    程序组件一起执行来实现应用程序的所期望的功能。应用程序组件有时被称为
    “实例”、“角色实例”或“应用程序角色实例”?!笆葜行淖试础卑ㄊ?br />据中心的计算资源,诸如服务器(也称为“节点”)、盘或虚拟机(VM)等。
    通常,数据中心包括一定数量的(例如成千上万的)独立资源,将这些独立资
    源结合在一起来形成资源网络。

    通常,应用程序包括指定如何在资源网络中部署应用程序的指令(也称为
    “应用程序模型”或“应用程序部署参数”)。例如,该指令可指示将应用程
    序部署成在五个不同的数据中心资源(例如,服务器)间均分的50个角色实
    例(即,应用程序组件),每一个角色实例包括单独的电源。因此,将在五个
    资源中的每一个上部署10个角色实例??山哂惺鼋巧道拿扛鲎橹付?br />为相应的虚拟分组(也称为“升级域”)。通常,基于应用程序模型的可用性
    约束,并不允许同时升级或迁移各虚拟分组。

    继续该实例,如果五个资源中的一个失效了,则本发明的实施例将十个应
    用程序组件从故障资源处迁移至健康资源处。而且,以与应用程序模型相一致
    的方式来重分配这十个应用程序组件。即,对这十个应用程序组件的迁移是在
    任何其他应用程序组件的重分配或任何其他维护操作被启动之前完成的,由此
    遵守了虚拟分组迁移的要求。另外,接收这十个应用程序组件的健康资源并不
    是其上部署有其他40个应用程序组件的那四个资源中的一个,由此遵守了需
    要五个不同的数据中心资源的参数。

    在简单描述了各实施例后,现描述图1,其中示出了用于实现本发明的各
    实施例的示例性操作环境,并将其概括指定为计算设备100。计算设备100只
    是合适的计算环境的一个示例,而非旨在对本发明的实施方式的使用范围或功
    能提出任何限制。也不应该将计算设备100解释为对所示出的任一组件或其组
    合有任何依赖性或要求。

    本发明的各实施例可以在由计算机或诸如个人数据助理或其它手持式设
    备之类的其它机器执行的计算机代码或机器可使用指令(包括诸如程序??橹?br />类的计算机可执行指令)的一般上下文中描述。一般而言,包括例程、程序、
    对象、组件、数据结构等等的程序??槭侵钢葱刑囟ㄈ挝窕蚴迪痔囟ǔ橄笫?br />类型的代码。本发明的各实施例可在各种系统配置中实施,这些系统配置包括
    手持式设备、消费电子产品、通用计算机、或更专用计算设备等等。本发明的
    各实施方式也可在任务由通过通信网络链接的远程处理设备来执行的分布式
    计算环境中实施。

    本发明的各实施例可被实现为:包含在一个或多个计算机可读介质上的方
    法、系统或指令集。计算机可读介质包括易失性和非易失性介质、可移动的和
    不可移动的介质,并设想可由数据库、交换机和各种其他网络设备读取的介质。
    作为示例,计算机可读介质包括以用于存储信息的任何方法或技术实现的介
    质。存储的信息的示例包括计算机可使用指令、数据结构、程序??橐约捌渌?br />数据表示。介质示例包括,但不仅限于,信息传送介质、RAM、ROM、EEPROM、
    闪存或其他存储技术,CD-ROM、数字多功能盘(DVD)、全息介质或其他光
    盘存储、磁带盒、磁带、磁盘存储器,及其他磁存储设备。这些技术可以即刻、
    临时或永久地存储数据。

    参考图1,计算设备100包括直接或间接耦合以下设备的总线110:存储
    器112、一个或多个处理器114、一个或多个呈现组件116、输入/输出端口118、
    输入/输出组件120、和电源122。总线110可表示一个或多个总线(诸如地址
    总线、数据总线或其组合)。虽然为了清楚起见利用线条示出了图1的各框,
    但是实际上,各组件的轮廓并不是那样清楚,并且比喻性地来说,线条更精确
    地将是灰色的和模糊的。例如,可以将诸如显示设备等的呈现组件认为是I/O
    组件。而且,处理器具有存储器??梢匀鲜兜?,这是本领域的特性,并且重申,
    图1只是说明可结合本发明的一个或多个实施例来使用的示例性计算设备。诸
    如“工作站”、“服务器”、“膝上型计算机”、“手持式设备”等分类之间
    没有区别,它们全部都被认为是在图1的范围之内的并且被称为“计算设备”。

    计算设备100通常包括各种计算机可读介质。作为示例,计算机可读介质
    可以包括:随机存取存储器(RAM)只读存储器(ROM)电可擦可编程
    序只读存储器(EEPROM)闪存或其他存储技术CDROM、数字多功能盘
    (DVD)或其他光学或全息介质;磁带盒、磁带、磁盘存储或其他磁存储设备;
    载波或可以用来编码所需要的信息并可以被计算设备100访问的任何其他介
    质。

    存储器112包括易失性和/或非易失性存储器形式的计算机存储介质。存储
    器可以是可移动的、不可移动的、或其组合。示例性硬件设备包括固态存储器、
    硬盘驱动器、光盘驱动器等等。计算设备100包括从诸如存储器112或I/O组
    件120之类的各种实体读取数据的一个或多个处理器114。呈现组件116向用
    户或其他设备呈现数据指示。示例性呈现组件包括显示设备、扬声器、打印组
    件、振动组件等等。

    I/O端口118可允许计算设备100在逻辑上耦合到包括I/O组件120在内
    的其他设备,其中一些可以是内置的。说明性组件包括话筒、操纵杆、游戏垫、
    碟形卫星天线、扫描仪、打印机、无线设备等等。

    现参考图2,描绘了适用于实现本发明的一实施例并由参考标记210来概
    括地标识的示例性操作环境?;肪?10包括一组联网的数据中心计算机资源212
    和控制器214,该控制器监控、维护以及向部署在数据中心处的主应用程序指
    派资源212。

    资源212包括资源A?216、资源B?218、资源C?220和资源D?222。资源
    A-D是出于说明性目的来描绘的;然而,资源212可以包括由省略号224指示
    的若干(例如成千上万的)其他资源。

    在图2中,已使用资源A?216和资源B?218部署了应用程序。资源A?216
    包括应用程序角色实例1226和应用程序角色实例2228,且资源B?218包括应
    用程序角色实例3230和应用程序角色实例4232。即,已使用资源A?216和资
    源B?218部署了应用程序(例如,在应用程序模型250中标识的“示例应用程
    序”),并且该应用程序包括至少四个角色实例。而且,将这四个角色实例(即,
    226、228、230和232)划分成虚拟分组(例如,升级域)。例如,虚拟分组
    A1包括角色实例1226和角色实例2228,且虚拟分组B1包括角色实例3230
    和角色实例4232。虽然出于说明的目的在图2中仅描绘了四个角色实例,但
    是应用程序可以包括部署在其他资源中的若干其他角色实例,并可被划分成更
    大的及更多数量的虚拟分组。

    资源A?216和资源B?218被添加了阴影,以描绘一有故障状态??梢猿鲇?br />各种原因,诸如在资源处于手动调查状态(例如,人类调查(HI)状态)或者
    修复状态(例如,“要进行修复(OutForRepair)”)时,认为资源包含有故
    障状态。资源212还包括资源C?220和资源D?222,这两者都未被添加阴影,
    以描绘一无故障状态。而且,资源C?220和资源D?222中的每一个都包括接收
    由空白框236、238、240和242指示的应用程序组件(例如,应用程序角色实
    例)的可用性。

    控制器214(例如,结构控制器)包括彼此通信的各种组件,并且包括联
    网计算机资源清单244、应用程序信息数据存储246和应用程序组件重分配器
    248。如之前描述的,控制器214监控、维护、以及向部署于数据中心的主应
    用程序指派资源212。因此,清单244包括包含在资源212中的所有资源的列
    表,并包括对每一资源的健康或状态的指示。例如,清单244列出了资源A并
    指示资源A包括一有故障状态。即,在清单244中列出的“资源A”与描绘在
    资源212中的资源A?216相对应。同样地,清单244还列出了资源B-D以及相
    应的状态指示。

    应用程序信息数据存储246存储有与使用资源212来进行部署的应用程序
    有关的信息。在数据存储246中存储的信息的示例性类型包括应用程序模型250
    和应用程序健康历史252。此处出于示例性的目的,在数据存储246中存储的
    信息涉及被描述为部署在资源A?216和资源B?218上的相同的应用程序。即,
    使用资源A?216和资源B?218来部署在信息254的分解图中标识的“示例应用
    程序”。应用程序模型250指示示例应用程序在已被部署时将包括在两个服务
    器之间划分的四个实例。应用程序健康历史252跟踪应用程序在整个时间段内
    已被重分配的次数和场合,并跟踪特定的应用程序组件(例如,实例)在整个
    时间段内已被重分配的次数。如将要在后面更详细描述地,与底层的硬件相对
    比,这种度量对于标识应用程序和/或应用程序组件何时会引起有故障状态是有
    用的。

    控制器214还包括应用程序组件重分配器248。重分配器248包括共同作
    用来实现如下各项的各个监控器:标识有故障资源、确定可用的及合适的(即,
    与应用程序模型一致的)无故障资源;以及根据应用程序模型250来将应用程
    序组件从有故障资源处迁移至无故障资源处。

    组件重分配器248包括标识包括有故障状态的资源(例如,服务器、盘或
    VM)的资源状态后台监控器256。在一个实施例中,当资源状态后台监控器
    256醒来时,它参考清单244来标识包括有故障状态的资源。例如,资源状态
    后台监控器256可参考清单244来确定资源A?216包括有故障状态。如之前描
    述地,资源A?216主存应用程序角色实例1226和应用程序角色实例2228。由
    于资源A?216已失效了,因此期望重分配应用程序角色实例1226和应用程序
    角色实例2228,以允许示例应用程序保持可用性。

    在标识了有故障资源以后,资源状态后台监控器256生成在复原任务队列
    262中维护的服务复原任务260。服务复原任务260包括需要从已标识的有故
    障资源处对应用程序组件进行重分配的指令。例如,如图2所描绘地,服务复
    原任务260可以包括需要从资源A处对应用程序角色实例1226进行重分配的
    指令。虽然没有明确地描绘,但是任务260可以同样包括需要从资源B处对角
    色实例2228进行重分配的指令。

    资源能够因为诸如部署数据中心控制软件升级的失败、配置改变或大量硬
    件故障等分组范围内的状况(即,网络范围内的状况)而进入有故障状态。在
    这种场景中,可能期望暂??刂破?14的至少一些操作,以允许调查或以其他
    方式来?;びτ贸绦蜃榧?。因此,重分配可能是不合需要的,因为它会干扰调
    查、从无故障节点处进行重分配、或以其他方式而不能恢复向应用程序分配的
    资源的健康。因此,资源状态后台监控器256包括依赖于分组健康的禁用器258。
    在生成服务复原任务(例如,260)前,禁用器258确定在一组资源中的有故
    障资源的数目是否超过了分组健康阈值。分组健康阈值是可配置的,并且可以
    包括有故障资源的阈值数目或有故障资源与无故障资源的比率。因此,禁用器
    258从清单244处确定有故障资源的数量,并将该数量与分组健康阈值进行比
    较。如果该数量低于阈值,则资源状态后台监控器256继续执行。然而,如果
    该数量超过了阈值,则禁用资源状态后台监控器256,由此挂起了复原操作。

    应用程序缺陷也能使资源进入有故障状态,使得对应用程序的连续重分配
    感染后续的资源。因此,资源状态后台监控器256包括依赖于应用程序复原率
    的禁用器264。在生成服务复原任务(例如,260)之前,禁用器264确定应用
    程序的复原频率(即,应用程序在给定时间段内已被复原了多少次)。例如,
    可参考应用程序健康历史252来确定应用程序在某一时间段内已被复原了多少
    次。禁用器264将应用程序的复原频率与应用程序复原率阈值进行比较。当应
    用程序的复原频率低于应用程序复原率阈值时,资源状态后台监控器256继续
    执行。然而,当应用程序的复原频率超过应用程序复原率阈值时,禁用器264
    禁用针对应用程序的进一步复原尝试。另外,可以发出警报或通知来指示应当
    对应用程序进行调查。

    可以使用各种方法来确定应用程序复原率阈值。例如,可以基于经验来试
    探性地确定应用程序复原率阈值?;蛘?或另外),应用程序复原率阈值可以
    基于进入了并非由应用程序缺陷所引起的有故障状态的资源的计算出的概率。
    在一个实施例中,使用泊松分布(Poisson?distribution)来确定该计算出的概率。
    即,如果事件以已知的平均速率发生,则泊松分布表达了事件(例如,资源进
    入有故障状态)在固定时间段内发生的概率,而不考虑从最后的事件开始的时
    间。因此,如果将应用程序主存到五个节点上,则使用泊松分布来表明这五个
    节点进入独立和随机发生的(即,并非由应用程序缺陷所引起的)有故障状态
    的频率。由这五个节点的故障,而非由泊松分布表明的频率,来指示应用程序
    缺陷可以引起故障。因此,泊松分布频率被可用作或用来表明应用程序复原率
    阈值。

    与使资源进入有故障状态的应用程序缺陷类似,应用程序组件(例如,实
    例)可以包括使资源进入有故障状态的缺陷。因此,资源状态后台监控器256
    包括依赖于组件复原率的禁用器266,其作用与依赖于应用程序复原率的禁用
    器264类似。即,在生成服务复原任务(例如,260)前,禁用器266确定组
    件的复原频率(即,组件在给定时间段内已被复原了多少次)。例如,可参考
    应用程序健康历史252来确定组件在某一时间段内已被复原了多少次。禁用器
    266将组件的复原频率与组件复原率阈值进行比较。当组件的复原频率低于组
    件复原率阈值时,资源状态后台监控器256继续运行。然而,当组件的复原频
    率超过组件复原率阈值时,禁用器266禁用针对组件的应用的进一步复原尝试。
    另外,可以发出警报或通知来指示应当调查应用程序组件。

    如果未被选中,则经由应用程序组件重分配器248的重分配可以在不考虑
    控制器214的工作负荷的情况下生成大量的任务。因此,可以建立阈值来限制
    在重分配会话中生成的任务的数目。即,资源状态后台监控器256部分地通过
    以下方式来起作用:从休眠状态中醒来、标识有故障资源、创建服务复原任务、
    以及返回到休眠状态。每当资源状态后台监控器256醒来时,它就会启动重分
    配会话。

    因此,为了管理控制器214的工作负荷,可以对允许资源状态后台监控器
    256在给定重分配会话中进行重分配的应用程序的大致数目设置上限。因此,
    每会话扼制器(per-session?throttle)268控制被允许在重分配会话中得到重分
    配的应用程序的数目。在每会话扼制器268建立每会话上限(per-session?cap)
    时,资源状态后台监控器256将大致地重分配的每会话上限,以舍入到(rounded?
    to)下一资源边界。例如,资源状态后台监控器256可以醒来并标识有故障的
    三个资源,每个资源主存了八个应用程序。如果每会话扼制器268将重分配的
    上限设为十个应用程序,则重分配三个资源中的两个(即,十六个应用程序),
    并在后续会话中重分配剩下的一个资源。即,当超过每会话上限(即,十个)
    时,将对最多到下一资源边界的列表(例如,十六个应用程序)进行重分配,
    但不会对更多的列表进行重分配。

    组件重分配后台监控器270使用(consume)服务复原任务,并标识应用
    程序组件可被迁移至的无故障资源。例如,在接收了服务复原任务260以后,
    组件重分配后台监控器270可参考清单244来标识可用来接收应用程序角色实
    例1226的资源。

    除了标识可用的无故障资源以外,组件重分配后台监控器270还确保应用
    程序角色实例1226到特定的无故障资源的迁移符合应用程序模型250。例如,
    应用程序模型250指定要使用两个服务器来部署示例应用程序。因此,即使单
    个服务器可用来主存应用程序角色实例1-4中的每一个,组件重分配后台监控
    器270也不会调度所有这些应用程序组件来使其重分配至该单个服务器。

    一旦组件重分配后台监控器270已标识了应用程序组件可被重分配至的可
    用和合适资源以后,组件重分配后台监控器270生成升级任务272。例如,升
    级任务272指示将应用程序角色实例1226重分配至资源C?220处。虽然没有
    明确地描绘,但任务272可以同样包括需要将角色实例2228重分配至可用和
    合适的资源处的指令。与应用程序角色实例2228有关的升级任务(例如,272)
    可指示应当将应用程序角色实例2228迁移至资源C?220或资源D?220处,只
    要维持与应用程序模型250的一致性。在滚动升级任务队列276中确定升级任
    务的优先级。

    组件重分配监控器270也可包括每会话扼制器274,其作用与每会话扼制
    器268类似。即,每会话扼制器274控制被允许在重分配会话中得到重分配的
    应用程序的数目。当每会话扼制器274建立每会话上限时,在醒来的组件重分
    配后台监控器270上处理数量大致等于该上限的服务复原任务。即,类似于资
    源状态后台监控器256,组件重分配后台监控器270可以处理舍入到下一资源
    边界的数目。

    滚动升级后台监控器278使用升级任务并执行对应用程序组件的重分配。
    例如,滚动升级后台监控器278使得应用程序角色实例1226被重分配至资源
    C处。在一实施例中,滚动升级后台监控器278符合虚拟分组规则。例如,滚
    动升级后台监控器278可在开始对同一应用程序的另一虚拟分组(例如,虚拟
    分组B1)的迁移之前,等待将该应用程序的整个虚拟分组(例如,虚拟分组
    A1)迁移至新的资源。在这方面,滚动升级任务队列并不遵循先入先出的处理
    方案。

    滚动升级后台监控器278也可包括每会话扼制器280,其作用与每会话扼
    制器268和每会话扼制器274类似。即,每会话扼制器280控制被允许在重分
    配会话中得到重分配的应用程序的数目。当每会话扼制器280建立了每会话上
    限时,在醒来的滚动升级后台监控器278上处理数目大致等于该上限的升级任
    务。即,类似于资源状态后台监控器256和组件重分配监控器270,滚动升级
    后台监控器270可以处理舍入到下一资源边界的数目。

    参考图3,描绘了概述在本发明的一实施例中执行的方法的流程图。一般
    由参考标记310来描绘该方法,并且在描述图3时,也可对图2作出参考。该
    方法可以被包含在其上包含计算机可执行指令的一个或多个计算机可读介质
    上,当执行指令时,便于实现一种将应用程序组件从有故障数据中心资源处重
    分配至无故障数据中心资源处的方法。

    方法310包括在312处标识其上主存有应用程序组件(例如,实例226和
    228)的有故障数据中心资源(例如,服务器、盘、虚拟机)。例如,可以在
    资源状态后台监控器醒来并参考清单244时,标识有故障数据中心资源。步骤
    314包括生成指示要将应用程序组件从有故障数据中心资源处转移走的服务复
    原任务(例如,260)。例如,在标识了有故障数据中心资源后,资源状态后
    台监控器256可以生成服务复原任务。

    在步骤316,方法310包括执行使用服务复原任务并标识无故障数据中心
    资源可用来接收应用程序组件的组件重分配后台监控器。例如,可检查应用程
    序模型250来确定在重分配应用程序组件时满足参数。示例性参数包括要在其
    中分摊应用程序组件的资源(例如,服务器)的总数??刹慰记宓?44来确定
    哪些资源是没有故障的,并确定选择了符合该参数的可用的无故障资源。

    步骤318包括生成指示要将应用程序组件转移到无故障数据中心资源处的
    滚动升级任务(例如,272)。另外,步骤320包括执行使用该滚动升级任务
    并将应用程序组件重分配至无故障数据中心资源处的滚动升级后台监控器。如
    之前所描述地,在执行方法310时,可以利用各种阈值(例如,每会话扼制器)
    来控制工作负荷以及检测何时会因数据中心范围内的处理(例如,分组健康阈
    值)或应用程序故障(例如,应用程序复原率阈值)而造成资源故障。

    现参考图4,描绘了概述在本发明的一实施例中执行的方法的另一流程图。
    一般由参考标记410来描绘该方法,并且在描述图4时,也可对图2作出参考。
    该方法可以被包含在其上包含计算机可执行指令的一个或多个计算机可读介
    质上,当执行指令时,便于实现一种将应用程序组件从有故障数据中心资源处
    重分配至无故障数据中心资源处的方法。

    在操作412处,方法410包括在一组数据中心资源中确定包含有故障数据
    中心资源的该组的一部分。另外,步骤414包括将该部分与分组健康阈值进行
    比较。例如,依赖于分组健康的禁用器258可以验证这部分有故障资源并不太
    多,其可表明在服务复原继续进行之前,应当考虑网络范围内的状况。

    操作416包括,当该部分低于分组健康阈值时,标识其上部署了应用程序
    组件的有故障数据中心资源,其中该应用程序组件在给定时间段内已被重分配
    了一定次数。而且,步骤418包括将该次数与另一阈值进行比较。其他阈值可
    包括应用程序复原率阈值、组件复原率阈值、或同时为应用程序复原率阈值和
    组件复原率阈值。例如,由于较高的重分配率表明应用程序是资源故障的基本
    起因,因此依赖于应用程序复原率的禁用器264可验证该次数并不太多。而且,
    操作420包括在该数量低于其他阈值时,将应用程序组件从有故障数据中心资
    源处重分配至无故障数据中心资源处。

    在不背离所附权利要求书的精神和范围的情况下,所描绘的各组件以及未
    示出的组件的许多不同的安排都是可能的。已带着说明而非限制的意图描述了
    本发明的各实施例。在阅读本发明之后或由于阅读了本发明,替换实施例将变
    得对本发明的读者显而易见??赏瓿墒迪稚鲜龅奶婊蛔爸枚煌牙胨饺ɡ?br />求书的范围。某些特征和子组合是有用的,并且可以使用而无需参考其他特征
    和子组合并且被认为是在权利要求书的范围之内的。

    关于本文
    本文标题:受控的数据中心服务的自动复原.pdf
    链接地址://www.4mum.com.cn/p-5817463.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 微信交易单号尾数控制 中国体肓彩票官方网站 贵州十一选五玩法 双色球中奖人 雪梨转发文章赚钱 内蒙古11选5开奖 无错36码大特围的110期 山东11选5开奖 重庆时时彩稳赚杀号 河北11选5开奖结结果 规律与现象 浙江11选5走式图 时时彩功夫计划 体育彩票11选5开奖 足彩混合投注什么意思 广西十一选五中奖助手