VMware vSphere Bitfusion

문득 vSphere Bitfusion에 대한 내용이 생각나서 기본적인 내용 몇가지 정리해 봅니다.

VMware vSphere Bitfusion

제품 홈페이지에는 다음과 같이 정의되어 있습니다.

vSphere Bitfusion은 환경 내 서버로부터 물리적 리소스를 분리합니다. 이 플랫폼은 서버별로 격리된 리소스가 아닌 네트워크 액세스가 가능한 리소스 풀로서 가상화된 인프라에서 GPU를 공유할 수 있습니다. Bitfusion은 AI 프레임워크, 클라우드, 네트워크 및 가상 머신, 컨테이너 및 노트북과 같은 환경에서 작동합니다. 그리고 새로운 하드웨어 가속화 장치가 도입되면 이에 따라 가상화를 구현할 만반의 준비를 갖추고 있습니다.

제품 설명서의 기능 부분에는 다음과 같이 설명되어 있구요.

vSphere Bitfusion 기능

vSphere Bitfusion 클라이언트에서 AI 또는 ML 애플리케이션을 시작하면 vSphere Bitfusion은 애플리케이션의 CUDA 호출을 가로채서 호출의 데이터와 데이터 포인터를 확인합니다. vSphere Bitfusion 서버는 데이터에 대한 연결은 필요하지 않고 vSphere Bitfusion 클라이언트에만 연결이 필요합니다. 클라이언트는 데이터 및 나머지 CUDA 호출을 서버로 전송합니다. vSphere Bitfusion 서버는 호출을 처리하고 결과를 클라이언트에 반환합니다.

AI 및 ML 애플리케이션을 실행할 때 vSphere Bitfusion은 다음 작업을 수행할 수 있습니다.

  • vSphere Bitfusion 서버에서 GPU 리소스를 동적으로 할당하고 액세스합니다.애플리케이션은 개별 시스템 전용이 아닌 GPU 리소스를 공유할 수 있고 구성된 시스템, 컨테이너 및 환경에서 각 애플리케이션을 실행할 수 있습니다. 애플리케이션은 네트워크를 통해 vSphere Bitfusion 서버 풀의 GPU 가속화 서비스를 사용하고 애플리케이션이나 세션이 실행되는 시간 동안만 리소스를 사용합니다. 애플리케이션 또는 세션이 완료되면 GPU가 풀로 반환됩니다.
  • 다른 애플리케이션과 동시 공유를 위해 GPU 리소스 파티션에 액세스합니다.GPU를 공유하는 또 다른 옵션은 GPU를 파티셔닝하는 것입니다. 물리적 GPU의 메모리를 임의의 크기로 나눌 수 있으며 동시에 여러 애플리케이션에 할당할 수 있습니다. vSphere Bitfusion은 삽입(interposition) 기술을 사용하여 공유를 수행합니다. vSphere Bitfusion은 일반적으로 PCIe 호스트 버스에서 로컬 가속기의 주소를 지정하는 API 호출을 가로채서 네트워크를 통해 API 호출 및 데이터를 보냅니다. vSphere Bitfusion은 AI 및 ML 애플리케이션에 대한 공유 서비스를 제공하고, NVIDIA GPU를 대상으로 하는 CUDA API를 지원합니다.

라이센스

vSphere 7.0 이상, Enterprise Plus 라이센스가 기본적으로 필요합니다. 여기에 추가로 BitFusion 애드온 라이센스를 per-CPU로 추가해야 합니다. per-CPU당 2 GPU를 지원합니다.

구체적인 내용은 아래 KB 링크 참고하기 바랍니다.

https://kb.vmware.com/s/article/80353

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like
Read More

Sub-NUMA 클러스터링

더 많은 ESXi 호스트에서 Sub-NUMA 클러스터링을 사용하도록 설정하는 추세를 확인했습니다. 일반적으로 이 설정은 고성능 컴퓨팅 공간 또는 통신…