성능이 새로운 ESA(vSAN Express 스토리지 아키텍처)의 주요 이점 중 하나인데, ESA가 Stretched Cluster에 어떤 이점을 제공할까요?
Stretched Cluster는 유럽 고객에게 널리 사용되는 토폴로지이므로 올해 초 VMware Explorer 유럽에서 이 질문이 자주 제기된 것은 당연합니다. vSAN 8의 ESA가 Stretched Cluster 토폴로지에 적합한 이유를 살펴보겠습니다.
ISL 전체에서 보다 효율적인 네트워크 트래픽
사이트 간에 데이터 복원력을 보장하려면 확장된 클러스터가 ISL(inter-site link)을 통해 쓰기를 전송해야 합니다. 그러나 ISL은 대역폭과 대기 시간에 의해 제한되기 때문에 효율적으로 수행해야 합니다. 이 문제를 해결하기 위해 vSAN은 “proxy owner”를 사용하여 ISL 사용을 최소화합니다. 개체 소유자의 반대편 사이트에 있으며, 사이트 내에서 후속 I/O를 처리할 수 있도록 개체 소유자로부터 복제된 쓰기를 수신합니다.
vSAN ESA에서 위에서 설명한 방법은 동일하지만 반전이 있습니다. vSAN ESA는 ISL 간 쓰기 복제 전에 데이터를 한 번 압축합니다. ESA를 사용할 때 동일한 워크로드에 대해 두 사이트 간에 ISL을 통해 전송되는 데이터를 줄이면 이전에 ISL 경합으로 인해 발생한 VM의 쓰기 지연 시간이 줄어듭니다. 또한 전송되는 데이터 양을 줄이는 것은 ISL의 대역폭을 늘리는 것과 동일한 결과를 가져올 수 있기 때문에 이 새로운 접근 방식은 ISL 전체에서 더 효과적인 쓰기 처리량을 제공합니다.
ESA는 또한 OSA와 다르게 데이터를 준비한다. 데이터를 디스크에 유지하기 전에 메모리의 많은 작은 쓰기 작업을 통합합니다. 큰 I/O 수가 적으면 쓰기 작업 수가 줄어들고 ISL 전체에 걸쳐 보다 균일한 데이터 전송 방법이 제공됩니다. 이러한 보다 효율적인 접근 방식은 리소스 활용률을 줄이고 확장된 클러스터에서 VM의 성능 일관성을 향상시킬 수 있습니다.
2차 복원력 사용 시 향상된 성능 향상
Stretched Cluster의 2차적 수준의 복원력을 통해 사이트 운영 중단 및 사이트 내에서 하나 이상의 후속 장애가 발생한 경우에도 데이터를 계속 사용할 수 있습니다. 고객은 스토리지 정책을 통해 VM에 이를 쉽게 적용할 수 있습니다.
vSAN OSA(Original Storage Architecture)를 사용할 때 VM이 보조 수준의 복원력을 VM에 적용하는 스토리지 정책, 특히 RAID-5/6 삭제 코딩을 사용할 경우 VM 성능에 영향을 미칠 수 있습니다. 이는 주로 쓰기 확인 응답을 게스트 VM에 다시 보내기 전에 각 사이트에서 패리티가 있는 RAID-5/6 스트라이프를 커밋할 때 발생한 읽기-수정-쓰기 단계(Performance with vSAN Stretched Clusters 참조) 때문이었습니다. ISL의 크기가 충분하더라도 I/O 증폭, 네트워크 왕복 및 직렬화를 증가시키는 것은 읽기-수정-쓰기 단계입니다. 이는 게스트 VM의 지연 시간에 영향을 줄 수 있습니다.
vSAN 8의 ESA는 더 적은 리소스를 사용하여 데이터를 씁니다. 소거 코딩을 사용하여 데이터를 복원력 있게 쓸 때 읽기-수정-쓰기 단계를 제거한다. 게시물: “RAID-5/6 with the Performance of RAID-1 using the vSAN Express Storage Architecture“에서 설명한 대로 게스트로부터 들어오는 쓰기 I/O는 통합되어 스토리지 정책에 따라 2-way 또는 3-way 미러로 잠시 작성된 후 VM에 쓰기 확인 메시지를 전송합니다. 이 접근 방식은 확장 클러스터에서도 사용되며, 여기서 쓰기 작업은 프록시 소유자에게 복제되며, 2-way 또는 3-way 미러는 효율적이고 완전히 정렬된 전체 스트라이프 쓰기로 쓰기 전에 각 사이트에서 발생합니다. OSA에서 발견되는 읽기-수정-쓰기 순서를 방지하면 VM의 쓰기 지연 시간을 줄이고 추가 호스트 리소스를 확보할 수 있습니다. 또한 RAID-5/6 삭제 코드를 사용할 때 성능 저하가 없기 때문에 스토리지 정책 관리가 간소화됩니다.
중소규모 Stretched Cluster의 공간 효율성 향상
위에서 언급한 바와 같이 Stretched Cluster의 2차적 수준의 복원력은 사이트 간 및 각 사이트 내에서 데이터 복원력을 제공합니다. 각 사이트에 3개의 호스트만 있는 소규모 Stretched Cluster(총 6개의 데이터 호스트)의 경우 RAID-5를 사용하려면 각 사이트에 4개의 호스트가 필요했기 때문에 2차 복원력 수준에서 RAID-1 미러를 사용하는 것으로 제한되었습니다. 이러한 상황에서는 RAID-1 미러가 소거 코딩보다 더 많은 용량을 소비하기 때문에 용량 활용도가 저하될 수 있습니다.
“Adaptive RAID-5 Erasure Coding with the Express Storage Architecture in vSAN 8” 덕분에 고객은 3개의 호스트만으로 RAID-5를 사용할 수 있습니다. 즉, 2개의 데이터 사이트 각각에 3개의 호스트만 포함된 확장 클러스터의 경우, 고객은 이 보조 수준의 복원력을 사용하면서도 상당한 수준의 공간 효율성으로 데이터를 저장할 수 있습니다. 각 사이트에서 6개 이상의 호스트를 사용하는 확장 클러스터의 경우 vSAN은 이 RAID-5 삭제 코딩을 매우 공간 효율적인 4+1 체계를 사용하도록 변경합니다. 공간 효율성과 호스트 수 비교는 그림 3을 참조하십시오.
암호화 사용 시 성능 향상
vSAN 암호화 서비스를 사용할 때 vSAN OSA는 성능 수준을 유지하는 데 탁월한 성과를 거두었지만, 특히 확장된 클러스터에서 암호화 서비스와 관련된 오버헤드를 줄이고 성능을 개선할 수 있는 기회가 있었습니다.
vSAN ESA는 암호화를 더 잘 수행합니다. ESA는 여전히 미사용 암호화와 전송 중 암호화를 두 개의 독립적인 서비스로 제공하지만, ESA는 더 적은 리소스를 사용하여 더 많은 데이터를 처리하도록 설계되었으며, 암호화의 경우도 마찬가지입니다. OSA와 달리 ESA는 vSAN 스택의 맨 위에서 데이터를 한 번 암호화하고 암호 해독 및 재암호화 단계를 수행하지 않습니다. 이렇게 하면 호스트의 리소스 오버헤드를 줄일 수 있을 뿐만 아니라 VM의 지연 시간을 줄일 수 있습니다.
계획되었거나 계획되지 않은 유지보수 이벤트에 대한 복원력 향상
vSAN의 OSA는 디스크 그룹의 구성을 사용하여 스토리지 리소스를 제공했습니다. 이는 가치 기반 SAS 또는 SATA 장치가 대부분인 vSAN 호스트에 합리적인 수준의 성능을 제공하는 효과적인 방법이었지만 디스크 그룹 캐싱 장치의 장애로 인해 전체 디스크 그룹의 데이터를 다른 곳에서 재동기화해야 한다는 점을 고려할 때 대부분의 고객 환경에 이상적이지 않았습니다.
ESA는 설계에서 하드웨어에 최적화된 접근 방식을 취한다. 따라서 고성능 NVMe 디바이스를 ESA의 아키텍처 변경 사항과 결합하여 이러한 디바이스의 모든 성능을 활용하면 vSAN ESA에서 디스크 그룹의 제한을 없앨 수 있습니다. 이를 통해 ESA를 보다 간편하게 관리할 수 있을 뿐만 아니라 장애/유지관리 도메인을 개별 스토리지 장치로 줄일 수 있습니다. 이는 모든 유형의 vSAN 토폴로지에 도움이 되지만 2차 수준의 복원력을 사용하지 않을 경우 ISL을 통해 사이트 간에 발생하는 재동기화를 크게 줄일 수 있습니다.
새로운 아키텍처는 ESA와 함께 사용하도록 인증된 고성능 NVMe 스토리지 디바이스만 지원하고 RAID-5/6 삭제 코드를 사용할 때 성능 저하가 발생하지 않으므로 확장된 클러스터 설계와 크기 조정이 쉬워집니다. OSA를 사용하면 확장 클러스터의 호스트에 매우 유능한 ISL 연결을 사용하는 구성을 흔히 볼 수 있었지만, 호스트는 가치 기반의 낮은 성능의 SATA 플래시 장치와 RAID-5/6 삭제 코딩을 사용하여 2차적인 복원력을 확보하고 있었습니다. 이제는 네트워크 연결과 클러스터 용량에 초점을 맞출 수 있습니다.
권장 사항: vSAN ReadyNode Sizer는 OSA와 ESA의 사이징을 모두 지원하므로 모든 싸이징 요구사항에 적합합니다.
확장 클러스터에서 ESA에 대한 네트워크 요구사항
vSAN ESA에 표준 vSAN 클러스터의 호스트에 대한 새로운 네트워킹 요구 사항 연결이 있지만 확장된 클러스터의 ISL에 대한 네트워크 요구 사항은 동일하게 유지됩니다. 데이터 사이트 간 네트워크 Round Trip Time (RTT)은 5밀리초(양방향으로 2.5ms) 이하여야 하며 데이터 사이트 간 ISL 대역폭은 10Gbps 이상으로 유지됩니다. vSAN(특히 vSAN ESA를 실행하는 클러스터)의 성능 기능이 증가함에 따라 ISL에 대한 요구사항과 함께 성능에 대한 기대치도 증가할 수 있습니다. 워크로드에 따라 수요가 결정됩니다. vSAN 확장 클러스터 대역폭 크기 조정 문서는 OSA 및 ESA의 ISL 크기 조정에 대한 일반적인 지침으로 사용할 수 있지만 vSAN ESA가 ISL 전체에서 데이터를 처리하는 다양한 방법을 지원하기 위해 추가 조정을 추가할 수 있습니다.
권장 사항: 확장 클러스터에서 ESA를 실행하는 경우 ISL에서 사용되는 유효 대역폭을 모니터링하여 크기가 올바른지 확인합니다. 워크로드의 요구 사항에 따라 ISL의 대역폭 및 대기 시간 기능을 다시 검토하여 기대 사항을 충족하고 ISL이 주요 병목 현상을 일으키지 않도록 해야 할 수도 있습니다.
맺음말
vSAN 확장 클러스터는 지리적 위치에 걸쳐 있는 환경에 고유한 복원 기능을 제공합니다. Stretched Cluster 환경에서 ESA를 사용하면 액티브-액티브 데이터 센터의 지속적인 요구사항을 충족할 수 있습니다.
출처 : https://core.vmware.com/blog/using-vsan-esa-stretched-cluster-topology