대부분의 vSAN 고객은 “개체(Object)” 및 “구성 요소(component)”라는 용어에 익숙하지만, 신규 사용자와 경험이 풍부한 사용자 모두가 이러한 용어가 무엇인지, 왜 존재하는지, 그리고 서로 어떻게 다른지에 대해 혼동할 수 있습니다. 이 게시물에서는 숙련된 vSAN 관리자든, vSAN의 작동 방식을 더 잘 이해하고자 하는 초보자든 관계없이 이러한 개념을 새로운 방식으로 설명하여 이러한 용어가 무엇이고 왜 중요한지를 더 잘 이해할 수 있도록 도와줍니다.
vSAN에 개체 및 구성 요소가 있는 이유
스토리지 시스템은 종종 개별 SSD 또는 스토리지 어레이의 LUN과 같은 블록 스토리지 장치 또는 장치에 데이터를 저장합니다. SCSI 명령은 데이터를 보내고 받는 데 사용되며 파일 시스템과 같은 주소 지정 가능한 형식을 통해 표시됩니다. NTFS를 사용하는 윈도우즈, Ext4를 사용하는 Linux 또는 VMFS와 같은 클러스터된 파일 시스템을 사용하는 vSphere와 같은 OS에 관계없이 이러한 파일 시스템은 단일 볼륨을 즉시 사용할 수 있는 모든 메타데이터와 데이터를 그대로 유지해야 하는 데이터의 논리적 경계로 취급하는 경향이 있습니다. 시스템의 어디에나 문제가 있는 경우, 데이터와 디렉터리 구조 정보를 제공하는 메타데이터의 일부를 사용할 수 없게 되어 파일 시스템 전체에서 임의로 적중할 수 있습니다. 이는 혼란스럽게 들리지만, 랩탑과 같은 단일 스토리지 장치 또는 단일 물리적 인클로저에 이중화 기능이 내장된 스토리지 어레이에 물리적 경계가 포함된 경우 파일 시스템이 제대로 작동할 수 있습니다.
분산 시스템은 여러 노드 또는 호스트의 스토리지 리소스를 집계하여 스토리지를 제공합니다. 그러나 잘 설계된 분산 스토리지 시스템은 클러스터 전체의 호스트 또는 디바이스에서 일시적이거나 지속적인 장애 상태를 고려해야 하며 호스트를 추가할 때 쉽게 스케일아웃해야 합니다. 분산 아키텍처에서 고전적인 파일 시스템을 사용하는 것은 이러한 조건에서 원하는 특성을 보여주지 못할 것이다.
따라서 vSAN은 스토리지에 대해 새로운 접근 방식을 취합니다. 개체 저장소 모델과 가장 유사한 저장소를 제공합니다. 모든 호스트에 걸쳐 분산된 데이터의 큰 경계를 생성하는 기존 파일 시스템을 사용하는 대신 가상 시스템과 같이 시스템에 저장하려는 엔티티에 대해 작은 데이터 경계를 사용합니다. 이 접근 방식은 vVols와 몇 가지 유사점을 공유합니다.
이 모델을 사용하여 “개체” 및 “구성요소”라는 용어를 사용하여 시각적으로 이해하기 쉬운 매우 일반적인 데이터 구조를 표현한다. 이것들을 좀 더 자세히 살펴봅시다.
vSAN 개체
vSAN에서는 개체를 데이터의 논리적 경계로 간주할 수 있습니다. 자체 블록 스토리지 장치/유닛으로 취급되며 SCSI 명령을 사용하여 데이터를 주고받지만 앞서 설명한 기존 스토리지 시스템에 비해 데이터 경계가 훨씬 작습니다. VM이 vSAN 데이터스토어에 저장되면 일반적으로 몇 개의 개체로 구성됩니다. vSAN에는 여러 유형의 개체가 있지만 가장 일반적인 개체의 예는 가상 디스크 또는 VMDK이며 이 게시물에 사용할 개체입니다. 클러스터된 파일 시스템과 비교하면 데이터 액세스의 경계가 더 작고 세분화되어 데이터 가용성이 결정됩니다. 이는 vSAN 관리자에게 중요한 이점을 제공합니다.
- 가용성 향상. 데이터 가용성은 모든 호스트에 분산된 전체 파일 시스템이 아니라 개체별로 결정됩니다.
- 확장성 단순화. vSAN은 파일 시스템의 잠금 메커니즘에 의존하는 대신 액세스의 결정자입니다. 소유권과 관련된 개념을 이해하고, 주어진 순간에 해당 개체에 액세스할 수 있고 액세스해야 하는 호스트를 파악합니다. 이렇게 하면 호스트 수에서 클러스터를 확장할 때의 액세스 복잡성이 제거됩니다.
- 보다 세분화된 관리 수준. 관리자는 스토리지 정책을 사용하여 원하는 결과를 손쉽게 다양한 개체에 처방할 수 있습니다.
vSAN 개체는 관리 가능한 가장 작은 데이터 단위입니다. 단일 스토리지 정책은 스토리지 정책을 사용하여 VM 그룹(여러 개체), 단일 VM(하나의 VM과만 관련된 개체) 또는 VMDK와 같은 단일 개체에 대한 공통 결과를 규정할 수 있습니다.
vSAN은 이러한 스토리지 단위를 개체라고 하지만 데이터 불변성 또는 다른 개체 저장소 유형 간의 호환성과 같은 개체 스토리지의 모든 특성을 모방하지는 않습니다. 그러나 Cloudian, Dell/EMC ECS 또는 Minio와 같은 파트너의 인증 솔루션과 함께 제공되는 NAT의 데이터 지속성 플랫폼을 사용하여 S3 호환 개체 데이터를 vSAN에 저장할 수 있습니다.
vSAN 구성 요소
개체의 복원력을 높이기 위해 개체를 더 작은 데이터 청크로 나누고 해당 데이터의 복사본을 클러스터의 다른 호스트에 배치합니다. 구성 요소는 개체 내에 포함된 데이터 청크를 나타냅니다. 개체는 하나 이상의 구성 요소로 구성될 수 있으며, 종종 RAID 트리라고 하는 개체의 다른 구성 요소에 대한 일종의 계층적 연결을 가질 수 있습니다.
위치, 개수 및 관계와 같은 개체 구성 요소의 레이아웃은 모두 vSAN에 의해 결정되고 관리됩니다. 스토리지 정책에서 적용하는 복원 정책 규칙, 개체의 데이터 양, 호스트에서 사용 가능한 디스크 용량 등 여러 요인이 이에 영향을 미칩니다. 예를 들어, vSAN은 RAID-5/6 데이터 배치 체계를 사용하는 개체의 일부인 단일 구성 요소는 동일한 호스트에 패리티가 있는 스트라이프의 다른 구성 요소를 가질 수 없다는 것을 이해합니다. 이 “반선호도”는 vSAN에 바로 내장되어 있으며 호스트 장애 발생 시에도 데이터를 사용할 수 있도록 보장합니다. vSAN이 이 모든 것을 처리하므로 필요하지 않습니다.
여러 면에서 구성요소를 구현 세부사항으로 생각하는 것이 가장 좋습니다. 사용자가 관리할 수 있는 엔티티가 아니므로 구성 요소 수준에서 관리 태스크를 수행할 필요가 없습니다. 그런데 왜 우리는 그들에 대해 이야기할까요? 고객이 데이터 가용성, 데이터 배치 체계 및 데이터 이동에 대한 개념을 이해하는 데 도움이 되는 단어와 그림을 통해 이를 설명합니다. 특정 개체가 성능 저하 상태에 있거나 새 스토리지 정책이 데이터 배치 방식에 어떤 영향을 미치는지 알 수 있습니다.
객체 및 구성요소의 시각적 표현
개체 구성 요소의 데이터 배치 체계가 복잡해질 수 있습니다. erasure code를 사용하는 객체는 mirror을 사용하는 객체와 다른 배치 방식을 가질 것이다. 스토리지 정책에 할당된 “개체당 디스크 스트라이프 수” 규칙에 따라 구성 요소를 더 작은 청크로 분할하거나 클러스터 내의 용량 제약으로 인해 분할할 수 있습니다. 좋은 소식은 관리자가 구성 요소가 어디에 있는지 신경 쓸 필요가 없다는 것입니다. 그러나 vCenter Server는 구성 요소 위치를 포함한 개체 데이터의 세부 정보를 표시합니다.
개체가 RAID-1/미러링 데이터 배치 체계를 사용하는 스토리지 정책을 사용하는 경우 여러 개체 복제본을 보여주는 그림(예: 그림 3)을 볼 수 있습니다. 이 경우 VMDK에 대해 여러 개체가 있는 것처럼 보일 수 있습니다. 이 작업은 미러링된 데이터의 계층적 관계를 복제본으로 표시하는 데 도움이 되지만 RAID-1 미러를 사용하는 개체는 하나의 개체일 뿐이고 개체 ID는 하나뿐입니다. 우리는 RAID 트리를 정확하게 나타내는 방식으로 미러링된 구성 요소를 그룹화합니다. RAID-5 또는 RAID-6 개체는 data+parity 삭제 코드를 사용하여 호스트 간에 데이터를 탄력적으로 배치하며 아래 그림 4와 유사하게 보입니다.
관리 및 모니터링
관리자의 경우 vSAN 개체는 관리 가능한 데이터의 최소 단위이므로 여기에 중점을 두어야 합니다. vSAN 개체는 스토리지 정책을 적용하여 관리됩니다. 스토리지 정책은 원하는 결과를 정의하며, vSAN은 클러스터에서 원하는 결과를 제공할 수 있는 경우 이를 보장하도록 작동합니다. 구성 요소는 개체의 가용성에 중요한 역할을 할 수 있으므로 vCenter Server는 개체 구성 요소의 배치를 보여 주며, 이는 가용성 문제의 세부 정보를 보여주는 데도 도움이 됩니다.
또한 Skyline Health for vSAN은 각 개체의 상태에 초점을 맞춘 수십 개의 상태 점검 기능을 제공하지만 트리거된 상태 경고가 있는 경우 관련 구성 요소에 대한 정보도 제공합니다.
권장 사항: 대부분의 vSAN 관리에는 Skyline Health 및 Monitor 탭을 사용합니다. 기존 데이터스토어와 달리 vCenter Server에서 vSAN 전원 클러스터에 대해 “데이터스토어” 보기를 사용할 필요가 거의 없습니다.
요약
vSAN은 데이터 스토리지에 대해 개체 저장소 모델과 가장 유사한 접근 방식을 사용합니다. vSAN은 분산 스토리지 솔루션이므로 이 모델을 사용하면 세분화된 레벨에서 예측 가능한 수준의 가용성을 제공하는 동시에 필요할 때 쉽게 확장할 수 있는 민첩성을 제공할 수 있습니다.
출처 : https://core.vmware.com/blog/vsan-objects-and-components-revisited