• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 12
    • 下载费用:30 金币  

    重庆时时彩012路稳赚: 一种高性能作业调度管理节点双机加固方法.pdf

    关 键 词:
    一种 性能 作业 调度 管理 节点 双机 加固 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201410174934.7

    申请日:

    2014.04.29

    公开号:

    CN103942128A

    公开日:

    2014.07.23

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情: 发明专利申请公布后的视为撤回IPC(主分类):G06F 11/16申请公布日:20140723|||实质审查的生效 IPC(主分类):G06F 11/16申请日:20140429|||公开
    IPC分类号: G06F11/16; G06F11/30 主分类号: G06F11/16
    申请人: 浪潮电子信息产业股份有限公司
    发明人: 马四腾
    地址: 250014 山东省济南市高新区舜雅路1036号
    优先权:
    专利代理机构: 济南信达专利事务所有限公司 37100 代理人: 姜明
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201410174934.7

    授权公告号:

    ||||||

    法律状态公告日:

    2017.11.21|||2015.11.04|||2014.07.23

    法律状态类型:

    发明专利申请公布后的视为撤回|||实质审查的生效|||公开

    摘要

    本发明公开了一种高性能作业调度管理节点双机加固方法,该方法主要是在高性能计算领域针对作业调度管理节点通过安装以及配置Pacemaker、corosync和drbd软件,达到节点级以及资源级的双重加固;该方法一方面避免了单机部署造成的单点故障问题,另一方面,采用pacemaker软件可以提供对作业系统资源监控,再加上drbd可以对作业调度系统的存储进行双机配置,比heartbeat+NFS方式中NFS共享作业调度系统存储具有双机冗余优势,更有效保证了系统运行的可靠性,可以有效的弥补了传统方法的不足。

    权利要求书

    权利要求书
    1.  一种高性能作业调度管理节点双机加固方法,其特征在于,所述双击加固方法是基于Pacemaker+corosync+drbd的高性能作业调度管理节点双机加固方法,其内容主要是在高性能集群中针对作业调度管理节点通过安装以及配置Pacemaker、corosync和drbd软件,达到节点级以及资源级的双重加固;
    其中,通过corosync软件对高性能集群中作业调度系统进行节点监控,能够配置多心跳,以确保在节点出现问题时,通知pacemaker进行资源切换;
    通过pacemaker软件对高性能集群中作业调度系统进行资源监控,一旦资源出现问题,会及时有效的对资源进行重启或者切换到其他节点;
    通过drbd软件配置作业调度系统存储的双机,drbd能够时刻保持双机中的存储数据一致;配置完毕后,作为资源受pacemaker软件监控。

    2.  根据权利要求1所述的高性能作业调度管理节点双机加固方法,其特征在于,该高性能作业调度管理节点双机加固方法的实现步骤为:
    在作业调度系统双机节点安装Corosync+pacemaker+drbd软件;
    对drbd软件进行配置;
    对corosync+pacemaker进行配置;
    启动corosync+pacemaker+drbd服务,对节点和资源进行监控。

    3.  根据权利要求1所述的高性能作业调度管理节点双机加固方法,其特征在于,该高性能作业调度管理节点双机加固方法的配置命令为:
    Drbd软件配置:
    global { usage-count yes; }
    common { syncer { rate 10M; } }
    resource r0 {
           protocol C;
           net {
           cram-hmac-alg sha1; 
           shared-secret "FooFunFactory";
           }
           on ha1 {
                  device         /dev/drbd1;
                  disk              /dev/sda3;
                  address              10.10.1.10:7789; 
                  meta-disk    internal;
                  }
           on ha2 {
                  device         /dev/drbd1;
                  disk              /dev/sda3; 
                  address              10.10.1.11:7789;
                  meta-disk    internal; 
                  }
           disk {
                  fencing resource-only; 
           }
           handlers {
           fence-peer "/usr/lib/drbd/crm-fence-peer.sh"; 
           after-resync-target "/usr/lib/drbd/crm-unfence-peer.sh";
           }
    }
    Pacemaker资源配置:
    crm configure show
    node ha1 \
            attributes standby="off"
    node ha2 \
            attributes standby="off"
    primitive fs_pbs ocf:heartbeat:Filesystem \
            params device="/dev/drbd1" directory="/drbddata" fstype="ext3" \
            op start interval="0" timeout="60s" \
            op stop interval="0" timeout="60s" \
            op monitor interval="100s" timeout="60s"
    primitive ip_pbs ocf:heartbeat:IPaddr2 \
            params ip="X.X.X.X" \
            op monitor interval="30s"
    primitive maui lsb:maui \
            op monitor interval="10s" timeout="20s"
    primitive pbs_drbd ocf:linbit:drbd \
            params drbd_resource="r0" \
            op start interval="0" timeout="240s" \
            op stop interval="0" timeout="240s" \
            op monitor interval="100s" role="Master" \
            op start interval="0" timeout="240s" \
            op stop interval="0" timeout="240s" \
            op monitor interval="120s" role="Slave"
    primitive pbs_server lsb:pbs_server \
            op monitor interval="10s" timeout="20s"
    primitive tomcat ocf:heartbeat:tomcat \
            params java_home="/usr/" catalina_home="/drbddata/apache-tomcat-6.0.18" \
            op monitor interval="10s" timeout="30s"
    ms ms_pbs_drbd pbs_drbd \
            meta master-max="1" master-node-max="1" clone-max="2" clone-node-max="1" notify="true"
    colocation drbd-with-server inf: fs_pbs pbs_server
    colocation location_pbs inf: fs_pbs ms_pbs_drbd:Master
    colocation server-with-ip inf: ip_pbs pbs_server maui tomcat
    order ip-after-server inf: pbs_server maui tomcat ip_pbs
    order order_pbs inf: ms_pbs_drbd:promote fs_pbs:start
    order server-after-drbd inf: fs_pbs pbs_server
    property $id="cib-bootstrap-options" \
            dc-version="1.0.12-unknown" \
            cluster-infrastructure="openais" \
            expected-quorum-votes="2" \
            stonith-enabled="false" \
            no-quorum-policy="ignore" \
            start-failure-is-fatal="false" \
            last-lrm-refresh="1375179478"
    rsc_defaults $id="rsc-options" \
            resource-stickiness="100"
    corosync节点配置文件:
    compatibility: whitetank
    totem {
            version: 2
            secauth: off
            threads: 0
            interface {
                    ringnumber: 0
                    bindnetaddr: 10.0.0.1
                    mcastaddr: 226.94.1.1
                    mcastport: 5405
            }
    }
    logging {
            fileline: off
            to_stderr: no
            to_logfile: yes
            to_syslog: yes
            logfile: /var/log/cluster/corosync.log
            debug: off
            timestamp: on
            logger_subsys {
                    subsys: AMF
                    debug: off
            }
    }
    amf {
            mode: disabled
    }
    service {
            ver: 0
            name: pacemaker
    }
    aisexec {
         user: root
         group: root
    }
    }。

    说明书

    说明书一种高性能作业调度管理节点双机加固方法
    技术领域
    本发明涉及计算机领域,尤其涉及一种基于Pacemaker+corosync+drbd的高性能作业调度管理节点双机加固方法。
    背景技术
    当前,基于网络的计算机技术,促进了集群系统的发展和广泛应用。用高速网络将高性能工作站或PC按某种结构连接成集群,实现并行计算,只用很小的花费,就可以得到大型机和并行机的性能; 然而,随着高性能计算集群应用规模的不断扩充,集群的管理问题也随之而来。作业调度系统主要负责接收用户提交的作业请求,并根据特定的调度规则以及用户对作业的要求选择合适的计算资源来完成用户作业。在作业调度系统的帮助下,对用户而言高性能计算集群系统就好像一台具备很多CPU的大服务器,多个用户可以同时使用这个系统。作业调度系统管理用户提交的作业,为各个作业合理地分配资源,从而确保充分利用集群系统的计算能力,并尽可能迅速地得到运算结果。因此作业调度系统的重要性也就不言而喻。
      然而,传统的作业调度系统往往采用单机方式或使用heartbeat+NFS方式做双机加固,这两种方法都存在一定的缺陷漏洞,比如管理节点单机部署,一旦该节点故障,会导致整个高性能集群的作业调度系统停止工作,整个集群的作业无法进行合理有效的调度,那么作业运行会出现停滞,严重影响系统运行效率;再比如使用heartbeat+NFS方式进行双机加固,由于heartbeat软件自身的设计因素,并不能对作业调度系统实行资源级监控,一旦监控的资源出现故障, 则不能有效的进行资源切换,会导致整个集群作业无法进行合理有效的调度,严重影响系统运行效率。由此可见,传统两种安全加固方法都有致命的缺点,故如何更加有效的对作业调度系统进行加固就成为一个亟待解决的问题。
    发明内容 
    针对现有技术存在的不足之处,本发明提供一种基于Pacemaker+corosync+drbd的高性能作业调度管理节点双机加固方法,该方法主要是在高性能计算领域针对作业调度管理节点使用Pacemaker+corosync+drbd进行双机安全加固。
    下面对Pacemaker、corosync、drbd进行说明:Corosync用来实现多个机器互相通讯(维持心跳)的,而pacemaker是在corosync上层来统一管理整个集群的运行;Distributed Replicated Block Device(DRBD)是一个用软件实现的、无共享的、服务器之间镜像块设备内容的存储复制解决方案,DRBD的核心功能通过Linux的内核实现,DRBD的位置处于文件系统以下,比文件系统更加靠近操作系统内核及IO栈。
    本发明公开了一种高性能作业调度管理节点双机加固方法,其解决所述技术问题采用的技术方案如下:所述双击加固方法是基于Pacemaker+corosync+drbd的高性能作业调度管理节点双机加固方法,其内容主要包括在高性能集群中针对作业调度管理节点通过安装以及配置Pacemaker、corosync和drbd软件,达到节点级以及资源级的双重加固;
    其中,通过corosync软件对高性能集群中作业调度系统进行节点监控,可以配置多心跳,以确保在节点出现问题时,通知pacemaker进行资源切换;
    通过pacemaker软件对高性能集群中作业调度系统进行资源监控,一旦资源出现问题,会及时有效的对资源进行重启或者切换到其他节点,确保资源运行正常;
    通过drbd软件配置作业调度系统存储的双机,drbd可以时刻保持双机中的存储数据一致;配置完毕后,作为资源受pacemaker软件监控。
    本发明公开的高性能作业调度管理节点双机加固方法的有益效果是:
    该方法采用了pacemaker+corosync+drbd方案进行双机加固,一方面避免了单机部署造成的单点故障问题,另一方面,采用pacemaker软件可以提供对作业系统资源监控,再加上drbd可以对作业调度系统的存储进行双机配置,比 heartbeat+NFS方式中NFS共享作业调度系统存储具有双机冗余优势,更有效保证了系统运行的可靠性,可以有效的弥补了传统方法的不足。
    该方法通过使用pacemaker+corosync+drbd的组合,来同时进行高性能集群中作业调度系统节点级以及资源级的监控,实现作业调度系统的无单点故障部署,该方案有很强的适用性和安全性。
    附图说明
    附图1为本发明所述高性能作业调度管理节点双机加固方法的架构图。
    具体实施方式
    下面通过实施例,对本发明所述高性能作业调度管理节点双机加固方法做进一步详细说明,并不造成对本发明的限制。
    本发明所述双机加固方法基于Pacemaker+corosync+drbd的高性能作业调度管理节点双机加固方法,其主要内容包括:
    1)          通过corosync软件对高性能集群中作业调度系统进行节点监控,可以配置多心跳,以确保在节点出现问题时,通知pacemaker进行资源切换;
    2)          通过pacemaker软件对高性能集群中作业调度系统进行资源监控,一旦资源出现问题,会及时有效的对资源进行重启或者切换到其他节点,确保资源运行正常;
    3)          通过drbd软件配置作业调度系统存储的双机,drbd可以时刻保持双机中的存储数据一致;配置完毕后,作为资源受pacemaker软件监控。
    综上可知,本发明所述高性能作业调度管理节点双机加固方法,是通过使用pacemaker+corosync+drbd的组合,来同时进行高性能集群中作业调度系统节点级以及资源级的监控,来达到相应的双机加固目的。
    实施例:
    本发明所述高性能作业调度管理节点双机加固方法通过以下步骤实现:
    1)  在作业调度系统双机节点安装Corosync+pacemaker+drbd软件;
    2)  对drbd软件进行配置;
    3)  对corosync+pacemaker进行配置;
    4)  启动corosync+pacemaker+drbd服务,对节点和资源进行监控。
    该基于Pacemaker+corosync+drbd的高性能作业调度管理节点双机加固方法配置命令:
    Drbd软件配置:
    global { usage-count yes; }
    common { syncer { rate 10M; } }
    resource r0 {
       protocol C;
       net {
       cram-hmac-alg sha1; 
       shared-secret "FooFunFactory";
       }
       on ha1 {
          device     /dev/drbd1;
          disk    /dev/sda3;
          address    10.10.1.10:7789; 
          meta-disk  internal;
          }
       on ha2 {
          device     /dev/drbd1;
          disk    /dev/sda3; 
          address    10.10.1.11:7789;
          meta-disk  internal; 
          }
       disk {
          fencing resource-only; 
       }
       handlers {
       fence-peer "/usr/lib/drbd/crm-fence-peer.sh"; 
       after-resync-target "/usr/lib/drbd/crm-unfence-peer.sh";
       }
    }
    Pacemaker资源配置:
    crm configure show
    node ha1 \
            attributes standby="off"
    node ha2 \
            attributes standby="off"
    primitive fs_pbs ocf:heartbeat:Filesystem \
            params device="/dev/drbd1" directory="/drbddata" fstype="ext3" \
            op start interval="0" timeout="60s" \
            op stop interval="0" timeout="60s" \
            op monitor interval="100s" timeout="60s"
    primitive ip_pbs ocf:heartbeat:IPaddr2 \
            params ip="X.X.X.X" \
            op monitor interval="30s"
    primitive maui lsb:maui \
            op monitor interval="10s" timeout="20s"
    primitive pbs_drbd ocf:linbit:drbd \
            params drbd_resource="r0" \
            op start interval="0" timeout="240s" \
            op stop interval="0" timeout="240s" \
            op monitor interval="100s" role="Master" \
            op start interval="0" timeout="240s" \
            op stop interval="0" timeout="240s" \
            op monitor interval="120s" role="Slave"
    primitive pbs_server lsb:pbs_server \
            op monitor interval="10s" timeout="20s"
    primitive tomcat ocf:heartbeat:tomcat \
            params java_home="/usr/" catalina_home="/drbddata/apache-tomcat-6.0.18" \
            op monitor interval="10s" timeout="30s"
    ms ms_pbs_drbd pbs_drbd \
            meta master-max="1" master-node-max="1" clone-max="2" clone-node-max="1" notify="true"
    colocation drbd-with-server inf: fs_pbs pbs_server
    colocation location_pbs inf: fs_pbs ms_pbs_drbd:Master
    colocation server-with-ip inf: ip_pbs pbs_server maui tomcat
    order ip-after-server inf: pbs_server maui tomcat ip_pbs
    order order_pbs inf: ms_pbs_drbd:promote fs_pbs:start
    order server-after-drbd inf: fs_pbs pbs_server
    property $id="cib-bootstrap-options" \
            dc-version="1.0.12-unknown" \
            cluster-infrastructure="openais" \
            expected-quorum-votes="2" \
            stonith-enabled="false" \
            no-quorum-policy="ignore" \
            start-failure-is-fatal="false" \
            last-lrm-refresh="1375179478"
    rsc_defaults $id="rsc-options" \
            resource-stickiness="100"
    corosync节点配置文件:
    compatibility: whitetank
    totem {
            version: 2
            secauth: off
            threads: 0
            interface {
                    ringnumber: 0
                    bindnetaddr: 10.0.0.1
                    mcastaddr: 226.94.1.1
                    mcastport: 5405
            }
    }
    logging {
            fileline: off
            to_stderr: no
            to_logfile: yes
            to_syslog: yes
            logfile: /var/log/cluster/corosync.log
            debug: off
            timestamp: on
            logger_subsys {
                    subsys: AMF
                    debug: off
            }
    }
    amf {
            mode: disabled
    }
    service {
            ver: 0
            name: pacemaker
    }
    aisexec {
         user: root
         group: root
    }
    }
    以上所述仅为本发明的实施例而已,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的?;し段е?。

    关于本文
    本文标题:一种高性能作业调度管理节点双机加固方法.pdf
    链接地址://www.4mum.com.cn/p-6143483.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 云南时时历史开奖结果 时时彩怎么能稳赚 打916单双倍投计划 北京pk10现场视频直播 重庆时时开奖彩经网 缅甸真人龙虎下载地址 重庆老时时开奖视频 赌大小怎样玩 玩赛车pk10有赚钱经验 龙虎和怎么玩才赢钱 下载安装够力七星彩奖表app 福利彩票投注时间截止 万人龙虎的计划是怎么编排的 北京pk10计划 pk10计划软件免费520 广东时时开奖20选8