Adaptive Network Traffic Shaping with the vSAN Express Storage Architecture

vSAN 8의 ESA(Express Storage Architecture)는 vSAN의 OSA(Original Storage Architecture)에서는 달성할 수 없었던 방식으로 성능과 효율성을 제공할 수 있습니다. vSAN은 이전보다 더 높은 속도로 데이터를 처리하고 저장할 수 있으므로 리소스 로드가 높을 때 스택의 다른 부분에서 경합이 발생할 수밖에 없습니다. 이를 해결하기 위해 VMware는 네트워크 경합 시 vSAN 트래픽의 최적 균형을 자동으로 제공하는 새로운 인텔리전스를 도입했습니다.

vSAN ESA를 사용한 적응형 네트워크 트래픽 쉐이핑과 그 중요성에 대해 알아보겠습니다.

변화하는 병목 현상 관리

스토리지 장치는 종종 스토리지 시스템의 주요 병목 현상이었습니다. 하이브리드 시스템의 회전 지연 시간이든, NAND 플래시의 성능을 제한하는 오래된 SAS 및 SATA 인터페이스든, 네트워크는 문제가 구성되지 않는 한 주요 병목 현상이 거의 없었습니다.

리소스를 놓고 경합하는 I/O를 관리하는 것은 다양한 유형의 스토리지 트래픽의 우선 순위를 최적으로 지정하는 데 도움이 될 수 있으므로 중요합니다. 재동기화는 vSAN이 규정된 스토리지 정책을 준수하도록 보장하고 클러스터 간에 데이터 균형을 조정하는 데 중요합니다. vSAN의 적응형 재동기화는 호스트에서 이러한 유형의 스토리지 디바이스 경합이 발생할 때 VM I/O와 재동기화 I/O의 흐름을 조절하는 데 매우 효과적이었습니다.

vSAN ESA의 데이터 경로 효율성과 NVMe 기반 TLC 플래시 장치의 탁월한 성능은 매우 빠른 속도로 처리할 수 있습니다. 워크로드에서 요구하는 경우 ESA는 처리량을 거의 장치 수준의 속도로 끌어올릴 수 있습니다. 서버에서 I/O 처리 속도가 더 빠르다는 것은 네트워크를 통과하는 I/O 속도가 더 높다는 것을 의미하며, 이는 재동기화 중에 까다로운 워크로드를 실행할 때 네트워크가 병목 현상을 일으킬 수 있습니다.

이를 지원하기 위해 vSAN 8의 ESA에는 네트워크를 통과하는 vSAN I/O를 위한 적응형 트래픽 조절 기능이 포함되어 있습니다. 이렇게 하면 네트워크 경합이 발생할 때 vSAN이 재동기화 작업보다 VM I/O를 적절하게 우선 순위를 지정할 수 있습니다. 이를 통해 네트워크 링크를 포화 상태로 만들 수 있는 이러한 까다로운 워크로드에 대해 보다 일관된 성능을 제공할 수 있습니다.

권고. ESA와 함께 사용하도록 선택한 vSAN Ready Nodes를 기준으로 네트워크 크기를 조정합니다. 적응형 네트워크 트래픽 조절 기능을 사용하면 특히 재동기화가 발생할 때 동일한 네트워크 리소스에 대해 경합하는 다양한 유형의 vSAN 트래픽에 우선 순위를 지정할 수 있습니다. 재동기화되지 않은 조건에서 완전히 포화된 네트워크 링크는 크기가 작은 네트워크를 나타내며 더 빠르고 높은 대역폭의 지연 시간이 짧은 네트워킹에 이상적인 후보입니다.

ESA를 사용하는 vSAN 클러스터의 네트워킹 요구 사항은 OSA에서 볼 수 있는 것보다 높습니다. 이는 vSAN ESA가 네트워크에서 더 까다로운 것으로 잘못 해석될 수 있으며, 이는 사실이 아닙니다. ReadyNode 프로파일은 25Gb 또는 100Gb를 최소 요구사항으로 정의하지만, 이 요구사항은 사용이 승인된 고성능 NVMe 기반 스토리지 장치의 장치 수준 성능에 근접한 성능을 제공하는 ESA의 능력을 반영합니다. 충분한 네트워크 리소스를 확보하면 vSAN이 최대 로드 상태에서 디바이스의 전체 성능 기능을 활용할 수 있습니다. 운영 워크로드를 vSAN OSA 클러스터에서 vSAN ESA 클러스터로 마이그레이션하는 경우 평균적으로 동일한 워크로드에 사용되는 CPU 및 네트워크 리소스가 줄어듭니다. 이는 vSAN ESA가 vSAN OSA에 비해 I/O를 처리하고 저장하는 데 사용하는 CPU 주기와 네트워크 리소스가 적기 때문입니다.

작동 방식

vSAN 8 ESA에 있는 적응형 네트워크 트래픽 쉐이핑은 적응형 재동기에 있는 논리와 유사한 방식을 공유하지만 vSAN 호스트의 스토리지 스택에서 vSAN I/O를 관리하는 대신 네트워크에서 vSAN I/O를 관리합니다. 경합이 없는 경우에는 서로 다른 유형의 vSAN 트래픽이 가능한 한 많은 네트워크 대역폭을 사용할 수 있습니다. 그림 1과 같이 vSAN 트래픽이 링크를 포화 상태로 만들면 대역폭의 20% 이하가 재동기화 트래픽에 사용되도록 트래픽을 자동으로 감지하고 조절합니다. 이렇게 하면 VM I/O가 항상 재동기화 I/O보다 높은 우선 순위로 제공됩니다. Adaptive Resync와 마찬가지로 완전히 자동화되어 있습니다.

이 메커니즘은 호스트별로 작동하며, 이는 분산 스토리지 시스템에서 Aggregate 스타일 측정 시 발생할 수 있는 몇 가지 문제를 방지하기 때문입니다. 각 호스트의 Distributed Object Manager는 한 호스트에서 다른 호스트로 전송되는 vSAN I/O의 RTT(라운드 트립) 지연 시간을 모니터링하고 해당 호스트의 동적 범위에 따라 작업 과정을 결정합니다. 지연 시간이 길수록 재동기화 트래픽이 적게 허용되고, 지연 시간이 낮을수록 더 많은 재동기화 트래픽이 허용됩니다.

측정값은 가중 롤링 평균에 의해 수집되고 분석되어 더 최근의 신호에 이전의 신호보다 더 많은 가중치를 부여합니다. 시그널링은 vSAN이 작업 과정을 결정하는 데 도움이 됩니다. 만약 그것이 조절된다면, 어디서, 그리고 얼마나 많이요. vSAN이 제어된 방식으로 스로틀을 올리고 내리는 데 도움이 되고 대역폭이 특정 유형의 I/O를 너무 많이 제한하지 않도록 하는 다른 메커니즘이 있습니다. vSAN 확장 클러스터의 경우 이 기능은 vSAN 확장 클러스터의 ISL(사이트 간 링크)을 관리하지 않고 지정된 사이트 내에서 vSAN 네트워크 I/O 트래픽을 관리합니다.

vSAN 적응형 네트워크 트래픽 조절은 NIOC(Network I/O Control)를 대체하지 않습니다. 이는 NIOC가 부여한 범위 내에서 작동하거나 네트워크에 부과된 다른 논리적 또는 물리적 제한에 따라 작동합니다. vSAN ESA를 사용하면 정체 메트릭이 전혀 표시되지 않거나 거의 표시되지 않을 수도 있습니다. 정체 메트릭은 스토리지 디바이스의 경합을 측정하고 적절한 조치를 취하기 위한 피드백 메커니즘 역할을 했습니다. ESA와 함께라면, 그 장치들이 논쟁의 대상이 되는 일은 거의 없을 것이다.

맺음말

ESA용 vSAN의 새로운 적응형 네트워크 트래픽 쉐이핑은 네트워크 경합에 대해 적응형 재동기가 스토리지 디바이스 경합에 대해 수행하는 역할을 합니다. 네트워크를 통해 vSAN 트래픽을 자동으로 관리하여 필요하지 않은 인상적인 새로운 기능입니다.

출처 : https://core.vmware.com/blog/adaptive-network-traffic-shaping-vsan-express-storage-architecture
답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like
Read More

vSAN v7.0U1에서 용량 관리

vSAN 7.0U1이 출시됨에 따라 이른바 “슬랙 공간(slack space)” 요구 사항에 대한 중대한 변경이 이루어졌다. Slack Space는 기본적으로 vSAN…
Read More

Flexible Topologies with vSAN Max

vSAN의 분산 아키텍처는 Stretched Cluster, 2-Node Cluster, 장애 도메인을 사용하는 클러스터와 같은 대체 토폴로지에 항상 적합했습니다. 하지만 vSAN…