容灾解决方案SRM.docx
《容灾解决方案SRM.docx》由会员分享,可在线阅读,更多相关《容灾解决方案SRM.docx(65页珍藏版)》请在咨信网上搜索。
1、 /*客户公司项目名*/软件定义的容灾解决方案(VMware Site Recovery Manager 5.8)2024/7/2 文档信息文档信息与变更记录与变更记录 文档名称 软件定义的容灾解决方案(SRM5.8)作者 高园 邮箱 版本 V1.0 变更记录 目目 录录 1 概述概述.错误!未定义书签。1.1 劫难恢复的重要意义劫难恢复的重要意义.错误!未定义书签。1.2 XXX 公司容灾方案现状分析公司容灾方案现状分析.错误!未定义书签。2 劫难恢复解决方案劫难恢复解决方案.错误!未定义书签。2.1 vCenter Site Recovery Manager.错误!未定义书签。2.1.1
2、概述概述.错误!未定义书签。2.1.2 Site Recovery Manager 的重要功能特性的重要功能特性.错误!未定义书签。2.1.3 SRM 支持灵活的拓扑支持灵活的拓扑.错误!未定义书签。2.1.4 超越劫难恢复:劫难规避和计划内迁移超越劫难恢复:劫难规避和计划内迁移.错误!未定义书签。2.1.5 VMware Site Recovery 的工作方式的工作方式.错误!未定义书签。2.1.6 劫难恢复自动化和运用软件定义的存储劫难恢复自动化和运用软件定义的存储.错误!未定义书签。2.2 vSphere Replication.错误!未定义书签。2.2.1 概览概览.错误!未定义书签。
3、2.2.2 运用运用 vSphere Replication 来扩大劫难恢复的覆盖范围来扩大劫难恢复的覆盖范围.错误!未定义书签。2.2.3 实现原理与工作机制实现原理与工作机制.错误!未定义书签。2.2.4 vSphere Replication 的优势的优势.错误!未定义书签。3 方案架构设计方案架构设计.错误!未定义书签。3.1 客户容灾设计规定客户容灾设计规定.错误!未定义书签。3.2 实行方案选择实行方案选择.错误!未定义书签。3.2.1 将基于阵列的复制与将基于阵列的复制与 SRM 结合使用结合使用.错误!未定义书签。3.2.2 将将 vSphere Replication 与与
4、SRM 结合使用结合使用 .错误!未定义书签。3.2.3 将基于阵列的复制和将基于阵列的复制和 vSphere Replication 与与 SRM 结合使用结合使用.错误!未定义书签。3.3 网络设计网络设计.错误!未定义书签。3.3.1 在恢复站点配置相同或不同的在恢复站点配置相同或不同的 IP 地址地址.错误!未定义书签。3.3.2 SRM 通通讯端口设立讯端口设立.错误!未定义书签。3.4 存储设计存储设计.错误!未定义书签。3.4.1 存储复制存储复制.错误!未定义书签。3.4.2 占位虚拟机占位虚拟机.错误!未定义书签。3.4.3 快照空间快照空间.错误!未定义书签。4 配置清单及
5、说明配置清单及说明.错误!未定义书签。4.1 硬件配置需求硬件配置需求.错误!未定义书签。4.2 虚拟化软件配置需求虚拟化软件配置需求.错误!未定义书签。5 方案总结方案总结.错误!未定义书签。5.1 方案要点方案要点.错误!未定义书签。5.2 方案优势方案优势.错误!未定义书签。6 专业服务专业服务.错误!未定义书签。6.1 VMware 专业服务介绍专业服务介绍.错误!未定义书签。6.2 专业征询服务内容专业征询服务内容.错误!未定义书签。6.2.1 VMware Accelerate 征询服务征询服务.错误!未定义书签。6.2.2 技术征询服务技术征询服务.错误!未定义书签。6.2.3
6、技术客户经理技术客户经理(TAM)服务服务.错误!未定义书签。6.3 专业服务实行流程专业服务实行流程.错误!未定义书签。6.3.1 评估评估.错误!未定义书签。6.3.2 规划与设计规划与设计.错误!未定义书签。6.3.3 实行实行.错误!未定义书签。6.3.4 运维运维.错误!未定义书签。7 支持服务概述支持服务概述.错误!未定义书签。7.1 VMware 支持的角色和职责支持的角色和职责.错误!未定义书签。7.2 全球技术支持服务全球技术支持服务.错误!未定义书签。7.3 自助服务支持自助服务支持.错误!未定义书签。7.3.1 社会支持社会支持.错误!未定义书签。7.3.2 其他资源其他
7、资源.错误!未定义书签。8 缩略语解释缩略语解释.错误!未定义书签。1 概述 1.1 劫难恢复的重要意义劫难恢复的重要意义 记录数据表白:93%的公司,一旦发生数据中心失效达 10 天的情况,通常在一年内就会破产。图:业务可用性与劫难恢复对公司的影响 来自 Forrestor 在 2023 年第二季度的征询报告表白,正常运营时间和数据保护对业务而言非常关键,劫难带来的员工工作效率下降、士气低落、收入下降、声誉受损和影响合规性将对公司产生巨大的悲观影响。图:中断导致的不良影响 劫难的发生往往是出乎人们意料的,当忽然发生大的劫难,平常建立的控制措施已不再有效时,组织如何才干保护核心业务不被中断,使
8、劫难的导致的风险降到最低呢?这正是劫难恢复需要考虑的问题。数据中心的劫难会以不同形式发生,比如电力中断、硬件故障、人为操作失误、以及自然灾害。大量的事例表白,业务中断不是“假如”的问题,而是“何时”的问题。因此,只要是拥有 IT 信息系统的组织,都应为随时也许发生的中断作好准备。保证业务连续性也就是保证业务连续运作,不管发生什么情况,重要的系统和网络必须具有不间断的可用性。事实上,劫难恢复的影响不仅仅局限于上面提到的金融领域,政府、公安、医疗、教育等诸多行业都需要使用业务可用性解决方案来保证其业务的可用性,对于这些公司,机关,单位而言,当 IT 基础设施忽然停运,不仅公司内部的业务流转、办公等
9、面临瘫痪,更重要的是,对外与客户或合作伙伴的所有业务交流都不得不陷入停滞。1.2 XXX 公司容灾方案现状分析公司容灾方案现状分析 在国内,很多公司都不具有劫难恢复能力,甚至是一些金融相关的公司都没有真正意义的劫难演练过。重要是设备成本、技术复杂度已经人员 IT 技能等多方面因素导致的。XXX 公司的采用传统灾备解决方案,并有了数年的积累和发展,但是传统的解决方案还是存在如下诸多问题的。一方面,传统的可用性解决方案是运用特定于应用的解决方案(如:Oracle RAC、MS SQL 集群、Exchange Database Access Groups(DAG)等)在应用级别实行业务可用性。虽然这
10、种方法通常可以提供不错的可用性,但是由于每一组应用都有自己的解决方案,因此这种方法有如下弊端:复杂且昂贵 对管理员的技术规定较高 犯错的风险大 许可证较贵(如 RAC)专用的备份架构 另一方面,虽然有一些基础架构层的解决方案可以比应用级解决方案更加经济高效,但是这些解决方案往往在正常运营时间和 RTO(恢复时间目的)方面表现得比较差。除此之外,传统的劫难恢复解决方案很难在现有的物理 X86 环境中实现,这是由于:传统的劫难恢复计划依赖于一套非常复杂的流程和基础架构:复制数据中心、复制服务器基础架构、将数据转移到恢复站点的流程、重启服务器的流程、重新安装操作系统的流程等等。由于劫难恢复也许非常复
11、杂,因此各个公司经常发现他们只能为少数几个重要的生产工作负载提供良好的保护,而其他的工作负载(如文献/打印服务器、内部 Web 服务器、部门级应用)则得不到保护或者保护的不充足。由于劫难恢复计划和基础架构非常复杂,所以各个公司都极为依赖大量的人员培训、准确且完整的恢复纪录,以及发生停机时恢复流程的准确执行。除此之外,由于恢复计划的测试过程会导致中断,并且成本非常高昂,所以各个公司无法保证所有培训、文档和执行过程都切实可行并且可以成功恢复 IT 服务。图:传统的劫难恢复解决方案所面临的挑战 上图描述了传统的劫难恢复解决方案所面临的挑战,由于存在这些挑战,该方案往往会产生如下的后果:恢复计划的测试
12、往往会失败 关键工作负载的基本恢复(如能成功)通常要花费数天或数周的时间 管理和维护恢复计划要花费 IT 人员大量的时间和资源 简言之,当前的灾备解决方案还无法满足其公司所设定的业务可用性规定。由此,XXX 公司提出重新设计和实行中心总部应用到北京 IDC 的异地远程灾备的需求。XXX 总部应用虚拟化改造完毕后,目前服务器虚拟化比例已经达成大约 XX%,XX%的应用已经由虚拟化承载,其中涉及 XX%的关键应用。需结合应用系统架构给出中心总部应用到北京 IDC 的异地远程灾备方案及实行日程表,按照日程表完毕异地远程灾备。2 劫难恢复解决方案 VMware 提出的基于虚拟化环境的软件定义的可用性解
13、决方案,该方案不仅可以提供与应用级别可用性方案相类似的 RTO 与 RPO(恢复点目的),同时,它还可以提供基础架构层解决方案所具有的简易性和成本效益。同时,由于该方案充足运用了虚拟化环境的优势,因此它可以达成传统的非软件定义解决方案无法达成的效果。VMware 劫难恢复解决方案涉及 vCenter Site Recovery Manager 和全新的vSphere Replication。2.1 vCenter Site Recovery Manager 如今,公司发现越来越难以提供符合规定的劫难恢复解决方案。而 Site Recovery Manager 可以帮助公司应对传统劫难恢复方法的
14、各种挑战,满足他们的恢复时间目的(RTO)、恢复点目的(RPO)以及法规遵从性规定。运用 Site Recovery Manager,公司可以管理从生产数据中心到劫难恢复站点的故障切换,同时,还可以管理两个互为恢复站点且具有活动工作负载的站点之间的故障切换。2.1.1 概述概述 VMware 的劫难恢复解决方案分为三个大的模块,如下图不同颜色模块所示:其中劫难恢复编排属于自动化解决方案;复制、备份和恢复属于数据保护解决方案;计算存储属于基础架构解决方案。图:VMware 劫难恢复解决方案 Site Recovery Manager 可以自动执行及简化故障切换至新数据中心的过程,从而让所计划的数
15、据中心故障切换(如数据中心迁移)变得更加顺畅。它是一款领先的劫难恢复管理和自动化解决方案,它通过自动执行恢复过程来加快恢复的速度,并将劫难恢复作为 VMware 虚拟基础架构管理的集成要素,从而简化劫难恢复计划的管理工作。SRM 省去了复杂的手动恢复环节,支持无中断的恢复计划测试,保证恢复过程的安全可靠。它密切集成 vSphere 及其他领先存储供应商提供的存储复制软件,使故障切换和恢复变得快捷、可靠、经济,并且便于管理。因此,公司不仅无需紧张劫难恢复的风险,还可将所有重要的系统和应用程序纳入到保护范围。自从 2023 年面世以来,SRM 已得到长足发展。到目前为止,VMware 已向一万五千
16、多家客户售出 12.5 万个许可证,并且该产品还在以每年 50%60%的速度继续增长。SRM 为 vSphere 平台上的劫难恢复计划增长的巨大价值推动了这种增长,而所增长的成本却相对较低。VMware 的许多客户已运用 SRM 从实际劫难(例如最近在日本发生的海啸和在美国发生的飓风)中快速恢复。下图是一些重要的客户以及 SRM 的相关市场数据。图:Site Recovery Manager 的发展趋势与部分客户 SRM 需要若干个组件。一方面,受保护的站点和故障切换站点都需要一个 SRM实例。SRM实例可通过与 vSphere 和 vCenter 紧密集成来提供管理和自动化功能。SRM 还需
17、要底层复制产品来将虚拟机复制到故障切换站点。借助 SRM,客户可以选择使用 vSphere Replication 或者使用基于存储的复制。由于 vSphere Replication与 SRM 捆绑在一起,所以无需支付额外费用。基于存储的复制由第三方存储供应商提供,并通过 Storage Replication Adapater(SRA)与 SRM 紧密集成,以使 SRM 可以运用该存储层协调复制和恢复活动。最后,SRM在这两个站点上都需要配置 vSphere 集群和单独的 vCenter 实例。图:SRM 的重要功能组件 2.1.2 Site Recovery Manager 的重要功能特
18、性的重要功能特性 VMware vCenter Site Recovery Manager 可提供先进的复制、劫难恢复管理、无中断测试、自动故障切换和故障恢复以及计划内迁移功能。它可以管理从生产数据中心到劫难恢复站点的故障切换,以及两个具有活动工作负载的站点之间的故障切换,甚至还可以将多个站点恢复为一个共享的恢复站点。Site Recovery Manager 经常用于计划内迁移和防止性故障切换以避免发生劫难,它的重要功能特性如下:集中式恢复计划集中式恢复计划 直接从 vCenter Server 中创建并管理恢复计划。自动发现并显示由 vSphere Replication 或基于阵列的复制
19、保护的虚拟机。将虚拟机映射到故障切换站点上的相应资源(资源池、虚拟 互换机和虚拟机文献夹)。指定虚拟机引导顺序。自定义虚拟机 IP 地址。自定义故障切换站点上的低优先级虚拟机的关机。运用自定义脚本扩展恢复计划。运用基于角色的访问控制来控制对恢复计划的访问。将多个站点恢复至一个共享的恢复站点。自服务,基于策略的调配自服务,基于策略的调配 可认为Site Recovery Manager 安装了VMware vCenter Orchestrator插件 多租户可以根据需求通过vRealize Automation Center中的蓝图(blueprints)预定义的各自的劫难恢复策略 自动执行故障
20、切换自动执行故障切换 接受关于也许的站点故障的自动警报。只需单击一次鼠标,即可在 vCenter Server 中开始执行恢复计划。自动停止用于恢复的复制数据存储的复制和升级。关闭故障切换站点上的低优先级虚拟机。按照预先指定的引导顺序自动启动受保护的虚拟机。在恢复过程中执行用户定义的脚本和暂停。在故障切换站点上自动重新配置虚拟机 IP 地址。从 vCenter Server 中管理和监控恢复计划的执行。自动故障恢复 自动故障恢复到原始生产站点。通过自动反向复制到原始站点来重新保护虚拟机。反向执行原始恢复计划。运用 vSphere Replication 中的自动故障恢复功能。计划内迁移 使用计
21、划内迁移工作流保证数据零损失和应用一致性迁移。在原始站点正常关闭受保护的虚拟机。执行数据同步以强制将关闭的虚拟机完整复制到故障切换 站点。执行运用应用一致性虚拟机的恢复计划。无中断测试 自动执行恢复测试。运用存储快照功能执行恢复测试,而不会中断复制。在隔离网络中恢复虚拟机,以免对生产应用程序导致任何 影响。针对测试方案自定义恢复计划的执行。完毕测试后自动清理测试环境。在 vCenter Server 中存储、查看和导出测试结果及故障切换 执行情况。支持 vSphere Replication 运用专为 vSphere 和 vCenter Site Recovery Manager 设计的唯一真
22、正基于虚拟化管理程序的复制产品。通过 vCenter 以精细灵活的虚拟机级别直接管理复制。使用与存储无关的复制支持使用低端存储,涉及直连存储。执行具有灵活 RPO(介于 15 分钟到 24 小时之间)的异步 复制。仅复制发生变更的数据块以提高网络效率。扩展到数百个虚拟机。运用对文献和应用一致性的支持。使用多时间点(MPIT)恢复来回到以前的已知状态。支持第三方基于阵列的复制 可在重要供应商提供的大量兼容性存储阵列和复制产品中进 行选择。使用基于 iSCSI、光纤通道或 NFS 存储的基于阵列的复制解 决方案。通过 SRA 保证与 vCenter Site Recovery Manager 紧密
23、集成。自动执行复制和数据同步操作,以实现协调一致的劫难恢复 故障切换和计划内迁移。2.1.3 SRM 支持灵活的拓扑支持灵活的拓扑 Site Recovery Manager 可用于多种不同的故障切换情形,特别是 SRM 能帮助客户更好地运用对辅助站点的投资,即,当客户没有处在劫难恢复情形中时,可将辅助站点用于其他工作负载而不是使其处在闲置状态,SRM 可用于如下四种不同的故障切换情形:积极-被动:Site Recovery Manager 完全支持传统的积极-被动型劫难恢复情形,即运营应用的生产站点将在故障切换之前一直处在闲置状态的辅助站点中恢复。尽管这是最常见的配置,但此情形也意味着您需要
24、为大部分时间都处在闲置状态的劫难恢复站点投入大量资金。积极-积极:为了更好地运用恢复站点,Site Recovery Manager 还可以使用户在不使用该恢复站点进行劫难恢复时将其用于其他工作负载。用户可以将Site Recovery Manager 配置为在故障切换过程中自动关闭或挂起位于恢复站点的虚拟机,这样就可以方便地释放计算容量以用于需要恢复的工作负载。双向切换:Site Recovery Manager 还可以提供双向故障切换保护,这样,您可以同时在这两个站点上运营活动的生产工作负载,并以任一方向对另一站点进行故障切换。另一站点上的备用容量将用于运营需要故障切换的虚拟机。本地故障切
25、换:尽管这不是常见情形,但有一些客户需要可以在指定的“站点”或园区中进行故障切换,例如,当存储阵列发生故障或者大楼维修迫使您将工作负载移动到其他园区大楼时。这些客户将运用 Site Recovery Manager 执行此类故障切换。图:SRM 支持灵活的拓扑 2.1.4 超越劫难恢复:劫难规避和计划内迁移超越劫难恢复:劫难规避和计划内迁移 SRM 不仅限于进行劫难故障切换,它更常用于平常迁移,例如用于劫难规避和计划内迁移。当然,劫难故障切换是最重要的使用情形,也就是当一个站点停止工作并且需要尽快将虚拟机迁移到辅助站点的时候使用。在这种情况下,SRM可支持完全或局部站点恢复,并将尽快执行故障切
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 解决方案 SRM
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。