当前位置: 澳门新濠3559 > 服务器运维 > 正文

他认为磁带是IT灾难恢复规划中必不可少的部分,

时间:2019-10-12 21:43来源:服务器运维
服务器虚拟化和云计算技术的兴起并不意味着我们不再需要良好的IT容灾规划,以及这些规划中可能使用到的磁带技术。以下是JonToigo在其StorageDecisions会议的主题发言中所提及的部分容

服务器虚拟化和云计算技术的兴起并不意味着我们不再需要良好的IT容灾规划,以及这些规划中可能使用到的磁带技术。以下是JonToigo在其StorageDecisions会议的主题发言中所提及的部分容灾技巧。

三分钟掌握数据中心“容灾和备份的区别”,数据中心容灾

一、前言

数据中心运行突发故障(如:天灾不可避免的灾难)是无法预测的,计算机里的数据就像扫雷游戏一样,十面埋伏充满雷区,随时都有可能Game Over,容灾备份就是数据安全的最后防线,但是你可以避免由数据中心发生故障而丢失数据引发的数据丢失的局面,下面,本文将介绍“容灾和备份的区别”以及一些尽可能减少发生运行故障失败机会,并加强企业的数据备份环境的简单要点。

图片 1

二、什么是容灾?

上世纪70年是容灾的起源期,80到90年代是容灾的快速发展期,90年代到2000年是容灾的膨胀期,从2010年开始互联网时代对业务连续的要求更高,IT进入了云的时代,容灾成为了一种服务。

容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。

容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。

图片 2

三、容灾的分类

从其对系统的保护程度来分,可以将容灾系统分为:数据容灾和应用容灾,数据容灾就是指建立一个异地的数据系统,该系统是本地关键应用数据的一个实时复制。

应用容灾是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统(可以是互为备份),在灾难情况下,远程系统迅速接管业务运行,数据容灾是抗御灾难的保障,而应用容灾则是容灾系统建设的目标。

四、容灾和备份有什么连系?

容灾备份实际上是两个概念,容灾是为了在遭遇灾害时能保证信息系统能正常运行,帮助企业实现业务连续性的目标,备份是为了应对灾难来临时造成的数据丢失问题。在容灾备份一体化产品出现之前,容灾系统与备份系统是独立的。容灾备份产品的最终目标是帮助企业应对人为误操作、软件错误、病毒入侵等"软"性灾害以及硬件故障、自然灾害等“硬”性灾害。

图片 3

五、容灾和备份的区别

一般意义上,备份指的是数据备份或系统备份,容灾指的是不在同一机房的数据备份或应用系统备份。备份采用备份软件技术实现,而容灾通过复制或镜像软件实现,两者的根本区别在于:

  • 容灾主要针对火灾、地震等重大自然灾害,因此备份中心与主中心间必须保证一定的安全距离;数据备份在同一数据中心进行。
  • 容灾系统不仅保护数据,更重要的目的在于保证业务的连续性;而数据备份系统只保护数据的安全性。
  • 容灾保证数据的完整性;备份则只能恢复出备份时间点以前的数据。
  • 容灾是在线过程;备份是离线过程。
  • 容灾系统中,两地的数据是实时一致的;备份的数据则具有一定的时效性。
  • 故障情况下,容灾系统的切换时间是几秒钟至几分钟;而备份系统的恢复时间可能几小时到几十小时。

图片 4

六、容灾的分类

1. 数据级

数据级容灾是最基础的手段,指通过建立异地容灾中心,做数据的远程备份,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏,但在数据级容灾这个级别,发生灾难时应用是会中断的。可以简单的把这种容灾方式理解成一个远程的数据备份中心,就是建立一个数据的备份系统或者一个容灾系统,比如数据库、文件等等。

  • 优点:费用比较低,构建实施相对简单
  • 缺点:数据级容灾的恢复时间比较长

2. 应用级

应用级容灾是在数据级容灾的基础之上,在备份站点同样构建一套相同的应用系统,通过同步或异步复制技术,这样可以保证关键应用在允许的时间范围内恢复运行,尽可能减少灾难带来的损失,让用户基本感受不到灾难的发生。应用级容灾就是建立一个应用的备份系统,比如一套OA系统正在运行,在另一个地方建立一套同样的OA系统。

  • 优点:提供的服务是完整、可靠、安全的,确保业务的连续性
  • 缺点:费用较高,需要更多软件的实现

3 业务级

业务级容灾是全业务的灾备,除了必要的IT相关技术,还要求具备全部的基础设施。

  • 优点:保障业务的连续性
  • 缺点:费用很高,还需要场所费用的投入,实施难度大。

图片 5

七、备份等级

容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。根据容灾系统对灾难的抵抗程度,可分为数据容灾和应用容灾。数据容灾是指建立一个异地的数据系统,该系统是对本地系统关键应用数据实时复制。当出现灾难时,可由异地系统迅速接替本地系统而保证业务的连续性。应用容灾比数据容灾层次更高,即在异地建立一套完整的、与本地数据系统相当的备份应用系统(可以同本地应用系统互为备份,也可与本地应用系统共同工作)。

在灾难出现后,远程应用系统迅速接管或承担本地应用系统的业务运行,设计一个容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等,根据这些因素和不同的应用场合,通常可将容灾备份分为四个等级。

1. 第0级:没有备援中心

这一级容灾备份,实际上没有灾难恢复能力,它只在本地进行数据备份,并且被备份的数据只在本地保存,没有送往异地。

图片 6

2. 第1级:本地磁带备份,异地保存

在本地将关键数据备份,然后送到异地保存。灾难发生后,按预定数据恢复程序恢复系统和数据。这种方案成本低、易于配置。但当数据量增大时,存在存储介质难管理的问题,并且当灾难发生时存在大量数据难以及时恢复的问题。为了解决此问题,灾难发生时,先恢复关键数据,后恢复非关键数据。

他认为磁带是IT灾难恢复规划中必不可少的部分,对于核心业务的容灾需求也应当被加入到整个架构当中。3. 第2级:热备份站点备份

在异地建立一个热备份点,通过网络进行数据备份。也就是通过网络以同步或异步方式,把主站点的数据备份到备份站点,备份站点一般只备份数据,不承担业务。当出现灾难时,备份站点接替主站点的业务,从而维护业务运行的连续性。

4. 第3级:活动备援中心

在相隔较远的地方分别建立两个数据中心,它们都处于工作状态,并进行相互数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。这种级别的备份根据实际要求和投入资金的多少,又可分为两种:

  • 两个数据中心之间只限于关键数据的相互备份;
  • 两个数据中心之间互为镜像,即零数据丢失等。零数据丢失是目前要求最高的一种容灾备份方式,它要求不管什么灾难发生,系统都能保证数据的安全。所以,它需要配置复杂的管理软件和专用的硬件设备,需要投资相对而言是最大的,但恢复速度也是最快的。

图片 7

八、改善备份性能的五大要点

1. 监控程序

在备份过程中,监控本身并不会导致发生故障运行失败,但其确实可以使得当某一个故障失败发生时更难以被发现。随着IT世界的范畴变得越来越广阔,备份系统必须进行改变,以查看和管理多个备份服务器。现在,大多数系统并不是设计用于同时监控多台服务器的,而如果一个问题出现,整个拆解过程会变得相当繁琐和困难。

解决方案:

我们所需要的是一款具有自动化功能的监控系统,该系统将能够汇编数据,并以图形方式提供用户界面,提供对于整个环境的一个全面的视图。同时对于个别服务器和客户端也应该是可视化的。为了进一步简化操作,该系统还必须能够监控在某一特定的业务中使用多供应商的备份。

2. 不要错过通知警报

虽然对于一般性的沟通问题而言,将电子邮件通知警报发送到适当的管理员通常是一个可靠的方式,但情况并不总是保持不变的。随着时间的推移,服务器,应用程序,备份设备和人员安置情况总是在变化的,因此,经常核实并确保警报能够在第一时间通知到恰当的工作人员来进行处理是非常有必要的。

解决方案:

实时警报是一款很好的解决方案。这种类型的警告可通过电子邮件、SNMP集成整合和SMS短信将警报发送给不同的人员,精确定位适当的人员来接收信息,并快速、高效地进行沟通。

图片 8

3. 注意命令行操作系统错误

虽然管理员可能更倾向于采用命令行界面来完成一项工作,但这很容易出错!原因是由于在使用该方法时,不同管理者之间的备份缺乏一致性。最佳的做法应该是通过及时更新来加强编纂,但这种情况并不经常发生,致使错误发生屡见不鲜。

解决方案:

一款用户界面允许GUI操作的备份功能必须添加到IT部门的备份系统。这样就减少了人为错误的机会,提高了当前操作的可重复性。

4. 对于报告和规划重视不足

由于企业的备份专业人员能够将主要精力集中在系统所发送的警报报告方面,但务必要记住的是,这些信息只提供了管理备份环境中的难题的一部分。很多时候,备份管理人员会错过某些特定部门和程序所发来的许多其他重要的报告。

当备份服务器开始托管传输的警报和监视数据时,问题很快就会随之而来。一般情况下,主备份服务器上的数据只保存很短的时间,可能导致其不能够再被访问,从而使得理解和防止下一次故障失败的任务变得几乎不可能。

解决方案:

遵循我所推荐的最佳实践方案,谨慎的做法是从初级的和分布式备份服务器编译数据到单个数据库,这将有助于保持日常数据备份的平稳运行。通过这种方式,可以进行数据分析,并在您的部门根据具体需求采用各种报告。

图片 9

5. 配置错误

虽然IT部门非常精通备份和恢复系统,但有时也可能出错。配置错误便是一个例子;这种情况经常发生,因为数据和服务器环境被扩大。下面是一些常见的问题:

恢复日志的规模大小不准确:这样的恢复日志可能会导致信息丢失。这种特殊的领域,必须手动扩大并重新启动,以避免灾难的发生。

从磁盘到磁带不匹配:当使用小的磁盘池时,可能存在新的数据不被接受、推迟备份、并导致错过了备份窗口的机会。只有一个线程可以从一个磁盘池写入到磁带设备,并且如果磁带不能处理数据必须从磁盘被写入的速度,磁盘池将不能够备份数据。

同时备份的过载:备份系统的最大客户端数很容易被超过,更不要说错过了备份窗口。这个问题可能会在数据环境增长和添加备份客户端时发生。

解决方案:

不管错误情况时怎样的,许多IT专业人士使用的都是更大型的监控系统,其提供了更全面的看法。这种更全面的视图提供了对于发现错误更直接的方法,并有助于在一个不断变化的环境中确定造成的因素。备份软件和监控系统被一起使用,以便IT部门可以准确评估备份环境的需求。

一、前言 数据中心运行突发故障(如:天灾不可避免的灾难)是无法预测的,计算...

作为ToigoPartnersInternational的执行总裁和管理合作伙伴,Toigo认为新技术和预算的削减不应当成为IT管理者降低对容灾关注的理由,容灾必须优先获得关注。

随着IT基础架构在新时代中的发展,采用云计算替代传统基础架构的趋势已日渐明显。其中以OpenStack为首的开源云正在逐步靠近各类IT业务系统的核心,承担起更加重要的角色。

“这其中最大的干扰声音来自服务器虚拟化和Hypervisor管理程序的供应商,”Toigo在其IT灾难恢复规划的演说中提到,“这些供应商正尽量让你觉得你可以不再需要灾难恢复系统了”。Toigo同时反驳磁带已经是落后技术的说法,他认为磁带是IT灾难恢复规划中必不可少的部分。“磁带消亡的说法简直就是胡说八道,”Toigo说。他表示磁盘容易损坏或出现故障,我们仍需要磁带来保存数据。

随着OpenStack内部架构的逐步完善,对于核心业务的容灾需求也应当被加入到整个架构当中。在以OpenStack为基础的容灾架构中不仅涵盖业务的数据和应用,还包括云主机配置,认证授权,网络等等容灾云的元素。OpenStack容灾架构的部署,对于提高IT业务的可靠性,可用性和连续性至关重要。

Toigo给出的一些建议可以有效地保护数据,并使得你的容灾系统走上正轨。他提出的第一项建议就是先进行完整的备份。Toigo说,你或许会很惊讶地发现有那么多企业没有完整和及时的备份,其中主要原因就是由于预算的削减和工作负荷的增大。

本文主要介绍OpenStack在DR灾难恢复场景下对应的技术解决方案,以及OpenStack灾难恢复服务DRaaS的规划、实施和建设。

“让自己至少完成最基本的数据保护,”他提到。

一、DRaaS的思想和原则

(一)几个概念

灾难(Disaster)是由于人为或自然的原因,造成一个数据中心内的信息系统运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件,通常导致信息系统需要切换到备用场地运行。

灾难恢复(Diaster Recovery)是指当灾难破坏生产中心时在不同地点的数据中心内恢复数据、应用或者业务的能力。

容灾是指除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。为了达到更高的可用性,许多用户甚至建立多个冗余站点。

衡量容灾系统有两个主要指标:RPO(Recovery Point Objective)和 RTO(Recovery Time Object),其中 RPO代表 了当灾难发生时允许丢失的数据量,而 RTO 则代表了系统恢复的时间。RPO 与 RTO 越小,系统的可用性就越高,当然用户需要的投资也越大。

(二)容灾级别

级别    

定义

RTO

数据级                

指通过建立同城/异地容灾中心和数据的远程备份/复制,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏。容灾切换时需要重新部署云主机,利用备份/复制数据恢复业务运行。

RTO 最长(若干小时)              

应用级

在数据级容灾的基础之上,在备份站点同样构建一套相同的OpenStack云,通过数据复制技术,保证关键应用在允许的时间范围内恢复运行,尽可能减少灾难带来的损失。

RTO 中等(若干分钟)

业务级

全业务的灾备,将灾备的范围扩大到整个Animbus OpenStack云。通过对控制节点元数据的复制,恢复一个完整的云环境,以及云上的所有组件和业务系统。

 RTO 最小(若干分钟或者秒)

(三)设计目标

设计的目标是通过部署DRaaS服务,能够满足并支撑:

  • 实现云主机与云硬盘数据跨站点备份/复制,确保灾难发生后,防止数据丢失或遭到破坏。
  • 实现OpenStack云容灾能力,云主机和数据具有异地恢复能力,提高系统的可靠性和连续性。
  • 优化DRaaS部署方式,提供模块化,可选择,可扩展的部署方式。提供一体化管理界面和可视化管理能力。

他同时建议管理员应当更多的记录宕机事件作为教训。“通过观察这些引起中断的事件,你可以从中学习到如何更有效地运营存储体系结构,以及在以后需要做什么来避免这些风险,”他补充道。

二、架构与设计

(一)DRaaS容灾架构

DRaaS容灾架构通过将Animbus OpenStack划分成三个层次,虚拟化层,控制层,管理层。虚拟化层集合了Animbus OpenStack的虚拟化资源,包括计算,存储和网络资源,属于容灾架构的核心层;控制层融合了Animbus OpenStack的管理组件,包括计算,认证,网络,存储,镜像等,属于容灾架构的中间层;管理层提供了对于整个DRaaS容灾环境的集中管理与监控,属于容灾架构的管理层。

在主备容灾两个Animbus OpenStack 环境之间,采用分层的容灾技术结构,包括云存储复制技术,云系统复制技术,云管理同步技术。通过整体容灾架构的部署,使得主备Animbus OpenStack环境具备容灾切换的能力。

图片 10

DRaaS架构示意图

(二)DRaaS容灾分级

DRaaS容灾架构可以根据业务场景和需求,实现三个不同等级的容灾级别。包括:

 数据级容灾DRaaS of Data

通过采用云存储复制技术,实现对Animbus OpenStack的数据级容灾。在灾难发生时,需重新部署云主机,利用Animbus OpenStack存储上的容灾数据实现数据恢复。这种方案价格最为低廉,RTO时间较长(若干小时)

应用级容灾DRaaS of Application

通过采用云系统复制技术,实现对Animbus OpenStack的应用级容灾。在灾难发生时,可以直接恢复云主机以及Animbus OpenStack后台存储的数据,局部或者全部恢复业务应用系统环境。这种方案价格相对经济,RTO时间较短(若干分钟)

业务级容灾DRaaS of Business

通过采用云管理同步技术,实现对Animbus OpenStack云环境的业务级容灾。在灾难发生时,通过容灾转移一键切换,可以快速的恢复整个Animbus OpenStack云平台环境。这种方案价格相对昂贵,RTO时间最短(若干分钟或秒)

 

记录下事件本身,起因以及导致的宕机时间和经济损失同样可以帮助你建立一个基于事实的容灾论证以进行管理。收集统计你公司自身的宕机事件较使用业内标准的统计数据更为有效。

三、容灾DRaaS的应用

 

(一)灾难定义

在信息系统服务时间段内,生产环境出现严重故障,系统中断,无法在短时间内本地恢复,可以通过启用同城灾备(异地灾备)环境实现业务的接管,可以根据灾难决策,实施灾难切换操作。

由于每次灾难产生的原因,影响的范围和时间长度,以及应对措施的差异。需要在制定容灾方案中,事先假设对于灾难场景的预设,然后可以根据不同的灾难场景,制定容灾方案以及灾难恢复计划。

(二)灾难场景

在DRaaS的容灾架构中,已经预设了多样的灾难场景,以及与之对应的容灾架构设计和容灾方案。通过这些容灾体系的建设,可以使整个Animbus OpenStack应对多样的灾难场景,实现快速的,安全的容灾切换。

  • 第一类-自然灾害,例如:火灾,水灾,地震……
  • 第二类-核心基础架构故障,例如:数据中心停电、核心存储宕机、广域网络中断、内部网络瘫痪、空调系统宕机……
  • 第三类-单个系统故障,例如:操作系统或者数据库系统崩溃、服务器硬件故障造成的宕机……

(三)DRaaS在实际灾难场景中的应用例子

某公司数据中心停电

案情:

由于电力故障,使其数据中心机房大面积停电。决定将IT业务系统整体容灾切换到位于另一处的备用数据中心。

在主备数据中心之间部署了基于Animbus OpenStack的DRaaS for Bussiness容灾环境,通过启用容灾环境的Animbus OpenStack云,迅速恢复原有的业务系统。保证业务应用的持续运行。

容灾恢复过程

灾难发生,业务应用出现无响应状态。

收集系统信息辅助决策,触发容灾切换方案。

关闭主中心Animbus OpenStack应用服务,断开数据复制线路。

恢复Animbus OpenStack备中心,并恢复业务访问。

图片 11

DRaaS在实际灾难场景中的应用示意图

他同时告知听众应当更认真地对待数据归档,将很少使用的数据从生产设备上下线,并将这些数据和日常数据的保护过程分开,比如复制备份。Toigo还希望参会者相信,当恢复应用时,所有的数据都将是必须的。

他使用微软的Exchange作为一个例子,指出你不仅需要邮件数据,还必须有设备驱动、邮箱配置以及活动目录设置。“这项应用并不只是其数据的集合,”Toigo解释道,“这些都是附加数据。你要恢复整个环境的话,就必须获取所有数据。”

Toigo同时劝告其听众对其数据镜像进行测试,以确保镜像操作能够正常进行,因为负责容灾的人员或许很少能及时了解卷文件何时被移走或者应用何时被迁移或增加。“停止镜像,并进行一致性检查,这样你会发现你希望镜像的是否正确地被镜像保护了,”他说,“最糟糕的是在发生灾难时你才发现出了问题。”

其它的一些关于容灾的建议包括:

使用存储虚拟化来避免被某家存储供应商锁定,以及在存储层进行本地和区域范围内的中断保护。

对主站点和复制站点进行三相检查,因为城域网的延迟会影响交易以及数据库数据的保护模式。

30天内的数据进行磁盘间的备份以快速回复用户操作引起的灾难,比如错误的文件删除。

将你的小型容灾站点用于测试,有些技术你可能没有经费在生产站点进行部署,但可以部署在测试站点。Toigo同时提到虚拟桌面以及IP电话等技术就可以这样部署。

...

编辑:服务器运维 本文来源:他认为磁带是IT灾难恢复规划中必不可少的部分,

关键词: 澳门新濠3559