Introducing VMware Cloud Disaster Recovery (VCDR)

VMworld 2019에서 나는 우리 사업부의 스포트라이트 세션을 GM인 John Gilmartin(여기서 전체 녹화를 볼 수 있다)과 함께 발표하게 되어 기뻤다. 많은 관심을 불러일으킨 주제 중 하나는 저렴한 재해 복구(DR) 서비스였다. 지난 한 해 동안 많은 일이 있었지만 가장 두드러진 것은 데이트리움의 인수였다. Datrium에서 인수한 스마트 솔루션과 함께 저비용 DRaaS(DRaaS) 솔루션의 원래 목표를 통합하여 이제 고객에게 새로운 VMware Cloud Disaster Recovery 서비스를 제공할 준비가 거의 다 된 시점이다.

VMware 클라우드 재해 복구에 대해 자세히 알아보기

그럼 어떻게 되는 거지? 사내 데이터 센터에 어떤 종류의 재해로부터 보호해야 하는 여러 가상 머신이 있다고 가정해 보자. 운영 사이트에서는 VMware VCDR(Cloud Disaster Recovery) 클라우드 기반 서비스에 연결하도록 구성된 DRaaS 커넥터를 설치하고 VM 보호를 시작하며, 가상 머신의 데이터는 클라우드 기반 스케일아웃 파일 시스템으로 복제되어 클라우드 효율적인 스토리지 타깃을 제공한다. 여기에 VM 데이터의 복제된 복사본이 저장된다. VCDR 관리는 DR용 SaaS Management Console이라고 생각할 수 있는 SaaS Orchestrator를 통해 달성된다. 사내 vSphere 환경의 DRaaS 커넥터를 SaaS Orchestrator에 연결하면 vCenter Server 등록, VM 보호 그룹 생성, 네트워크 매핑을 위한 사이트 쌍 설정 등의 작업을 수행할 수 있음rks, 폴더, 리소스 풀, 데이터스토어 등을 차례로 실행한 다음 이러한 보호 그룹에 대한 DR 계획을 실행하십시오. 이는 테스트 계획 또는 실제 페일오버 계획일 수 있으므로, VCDR을 사용하여 테스트 계획도 실행할 수 있다.

인터페이스는 vSphere 관리자가 매우 쉽게 사용할 수 있는 다음과 같은 형태로 나타날 것으로 예상:

재해 발생 시 컴퓨팅 복구에 사용할 수 있는 옵션은 두 가지다. VCDR은 (a) AWS의 VMware Cloud에서 새로운 SDDC 클러스터를 온디맨드 방식으로 가동하거나, (b) 매우 작은 “시범 조명” SDDC 클러스터를 유지 관리하여 복구 시간을 단축할 수 있다. 클라우드의 컴퓨팅 유지 보수 비용 대비 복구 속도가 더 빠른 것으로 요약된다. 두 경우 모두 스케일 아웃 파일 시스템에서 유지 관리되는 가상 시스템 디스크의 복제된 복사본은 처음에 “NFS 라이브 마운트”를 통해 AWS SDDC 호스트의 VMW에 표시되며 SDDC를 사용할 수 있고 NFS 데이터스토어가 호스트에 마운트되면 즉시 전원이 켜진다. 동시에 Storage vMotion은 SDDC의 기본 스토리지로 VM 데이터 마이그레이션을 시작한다. 데이터가 완전히 마이그레이션되면 최적의 성능을 위해 “NFS 라이브 마운트” 복사본 대신 이러한 복원된 데이터 복사본이 사용된다.

테스트 및 페일오버 계획은 기본적으로 사용되지만 데이터의 최신 복사본을 사용할 필요가 없다는 점에 유의해야 한다. 각 복제는 데이터의 스냅샷 복사본을 생성하므로 실제로 과거로 돌아가서 이전 스냅샷을 사용할 수 있다. 이는 랜섬웨어의 경우 이벤트가 발생한 시점 이전의 시점까지 여러 번 반복해야 하는 경우에 매우 유용할 수 있다. 또한 테스트 계획에는 “실시간 마운트 NFS”에 남아 있거나, 테스트 계획에서 Primary 스토리지의 데이터를 재하이드레이션(re-hydrate)해야 한다고 결정할 수 있다.

또 다른 주요 특징은 “델타 기반 페일백”이다. 운영 사이트에서 워크로드를 다시 실행할 준비가 되면 VCDR은 페일오버 전에 사내 VM에서 마지막으로 복제된 시기를 파악하고 이를 사용하여 복원해야 하는 데이터 양을 결정할 수 있다. 따라서 클라우드에서 전체 복원을 수행할 필요가 없다. 대신 VCDR은 프로덕션 사이트와 클라우드 모두에 있는 내용을 비교하고 페일오버 이후 발생한 변경 사항의 델타만 동기화한다. 아주 멋진 기능이다.

다음은 위의 특징과 워크플로우를 나타내는 간단한 다이어그램이다.

물론 운영 환경에 다시 장애가 발생한 후에는 페일오버 기간 동안 AWS의 VMC에 있었던 SDDC 클러스터를 폐기한다. 이것이 이 솔루션에서 사용할 수 있는 클라우드 경제에 대한 고마움을 제공하기를 바란다.

내가 정말 유용하다고 생각하는 한 가지 추가 기능은 DR 계획에 대해 30분마다 지속적으로 컴플라이언스 검사를 실행한다는 사실이다. 이는 연결, 네트워킹 및 리소스 풀 매핑, 데이터스토어 가용성, IP 주소 가용성 등이 모두 정기적으로 확인됨을 의미한다. 따라서 페일오버 계획이나 테스트 계획도 시도하기 전에 사내 및 클라우드(실패) 환경이 모두 검증되었다는 확신을 가질 수 있다. 아주 멋진 기능. 아래는 DR 계획의 지속적인 준수를 보여주는 스크린샷이다.

VMware 사이트 복구는 어떻게 하시겠습니까?

이제 이것이 기존 클라우드 기반 DR 제품인 VMware Site Recovery(VSR)와 어떻게 비교되는지 궁금하시겠지요. 음, 그래, 비슷한 점이 있어. 페일오버 및 페일백을 비롯한 DR 조정을 위해 이 두 가지 기능을 모두 VMware 환경에서 사용할 수 있다. 두 제품 모두 vSphere 구조를 사용하기 때문에 VI-Admin에 익숙해야 한다. 하지만 중요한 차이점도 있다. VCDR은 경제적인 클라우드 기반 스케일아웃 파일 시스템으로 복제하는 반면 VSR은 AWS의 VMW에서 SDDC의 기본 스토리지로 직접 복제한다. 즉, VSR을 위해 AWS의 VMC에서 SDDC 환경을 이미 사용하고 사용할 수 있어야 함을 의미한다. 물론 페일오버 용량이 이미 프로비저닝되었기 때문에 RTO(복구 시간 목표)가 훨씬 빨라지는 등의 이점도 있다. SDDC가 대기하거나 ‘pilot-light’ SDDC가 스케일아웃되기를 기다리는 데 오버헤드가 없으며, 이는 RTO에 직접적인 영향을 미친다.

두 번째 차이점은 VMware Site Recovery가 사내 VM 데이터를 30분 이내에 복제할 수 있기 때문에 RPO(복구 시점 목표)도 훨씬 작다는 점이다. 우리는 VCDR을 통해 4시간의 RPO를 검토하고 있다.

RTO와 RPO는 확실히 VCDR을 VSR과 비교할 때 고려해야 할 두 가지 주요 요인이다. 그리고 물론, 이 방정식에 들어가는 다른 주요 요인의 비용. DRaaS를 볼 때 평가해야 할 핵심 사항들이다.

VMworld 2020에서 VMware 클라우드 재난 복구

VMworld 2020에서 VCDR에 대한 3가지 프레젠테이션이 있었는데, 이 프레젠테이션은 이미 상위 15개 세션에서 언급했었습니다. VCDR에 관심이 있는 사람은 반드시 시간을 내어 이 프레젠테이션을 시청하기 바란다.

[HCI2876] Don’t be left in the Cold: Protect vSphere with Datrium-based Warm DRaaS. 이 세션은 DRaaS 도입 단계 100이며 DRaaS에 대한 비즈니스 개요를 제공한다.

[HCI2865] Protect all your workloads with DRaaS from VMware. Datrium 인수에 대한 모든 정보와 AWS에서 VMware Cloud를 위한 DRaaS(Disaster Recovery as a Services)를 구현하는 방법에 대해 알아보십시오. 이것은 해결책에 대한 레벨 200의 소개를 충분히 제공할 것이다.

[HCI2886] Deep Dive into DRaaS based on Datrium. 이 브레이크아웃에서는 새로운 DRaaS 솔루션의 핵심 사항(레벨 300)에 대해 알아보십시오.

그 팀은 VCDR에 대한 당신의 피드백을 듣고 싶어할 것이다. 사용할 것 같아? 당신이 그것을 사용하지 않을 이유가 있는가? 저희에게 알려 주기 바란다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like
Read More

Sub-NUMA 클러스터링

더 많은 ESXi 호스트에서 Sub-NUMA 클러스터링을 사용하도록 설정하는 추세를 확인했습니다. 일반적으로 이 설정은 고성능 컴퓨팅 공간 또는 통신…