MCP를 통해 OpenShift Lightspeed와 사고 감지 통합

Red Hat Blog를 보다가 관심 가는 글이 보여서 AI번역+약간 교정해 보았습니다.
출처: https://developers.redhat.com/articles/2025/10/09/integrate-incident-detection-openshift-lightspeed-mcp

Red Hat OpenShift 의 인시던트 감지 기능이 이제 OpenShift용 AI 기반 가상 비서인 OpenShift Lightspeed 와 통합되었습니다. 이를 통해 대화형 인터페이스에서 인시던트 분석이 바로 가능해져 클러스터 문제를 탐색하고 해결하는 방식이 변화합니다.

 Cluster Observability Operator(COO) 의 일부인 인시던트 감지 기능은 관련 알림을 인시던트로 그룹화하여 관측성을 간소화합니다. 이를 통해 알림 피로도를 줄이고 문제의 근본 원인에 집중할 수 있습니다.

Lightspeed에서 제공되는 인시던트 데이터를 사용하면 정적 뷰를 넘어 자연어로 클러스터와 상호 작용할 수 있습니다. 그림 1과 같이 문제가 서로 관련이 있는지 확인하고, 증상을 자세히 살펴보거나, 문제의 원인인 이벤트 체인을 요청할 수 있습니다.

OpenShift Lightspeed를 통한 근본 원인 분석 및 사고 감지
그림 1: 인그레스 컨트롤러가 다운된 근본 원인에 대해 OpenShift Lightspeed에 쿼리를 보내는 모습입니다.

OpenShift Lightspeed와의 통합은  Model Context Protocol(MCP) 을 통해 이루어지며 , 사고 감지 엔진은 MCP 서버를 통해 노출됩니다 . MCP는 대규모 언어 모델(LLM) 애플리케이션을 외부 시스템과 연결하기 위한 오픈 소스 표준입니다.

사고 감지 MCP 서버 설치

다음 단계에 따라 사고 감지 MCP 서버를 설치하고 OpenShift Lightspeed를 구성하여 이를 사용하세요.

메모: 이 기능은 개발자 미리보기에서만 제공됩니다. 자세한 내용은 개발자 미리보기 지원 설명서를 참조하세요.

필수 조건:

  • OpenShift 4.19를 실행하는 클러스터
  • OpenAI(또는 다른 LLM 공급자) API 키
  • OpenShift CLI ( oc)
  1. Red Hat OpenShift Container Platform 웹 콘솔을 사용하여 OperatorHub에서 Cluster Observability Operator 1.2.2+를 설치합니다 .
    1. 클러스터 관찰 운영자 설치(그림 2) 중에 이 네임스페이스에서 운영자가 권장하는 클러스터 모니터링 사용을 선택해야 합니다 . 그렇지 않으면 사고 감지가 제대로 작동하지 않습니다.그림 2: 운영자가 권장하는 클러스터 모니터링을 활성화하는 옵션을 선택합니다.
Select “Enable Operator recommended cluster monitoring on this Namespace”

2. 이전 블로그 게시물의 지침에 따라 사고 감지 기능을 활성화하세요 .

3. Incident Detection MCP 서버의 개발자 미리보기를 설치하세요.

oc apply -f https://raw.githubusercontent.com/openshift/cluster-health-analyzer/refs/heads/mcp-dev-preview/manifests/mcp/01_service_account.yaml
oc apply -f https://raw.githubusercontent.com/openshift/cluster-health-analyzer/refs/heads/mcp-dev-preview/manifests/mcp/02_deployment.yaml
oc apply -f https://raw.githubusercontent.com/openshift/cluster-health-analyzer/refs/heads/mcp-dev-preview/manifests/mcp/03_mcp_service.yaml

4. OperatorHub에서 OpenShift Lightspeed 1.0.5+를 설치하세요.

5. OpenAI(또는 다른 LLM 공급자) API 키를 비밀로 저장합니다.

oc create secret generic -n openshift-lightspeed credentials --from-literal=apitoken=<YOUR_API_KEY>

LLM과 상호 작용하려면 API 토큰이 필요하며, 클러스터에서 비밀로 사용할 수 있어야 합니다.

6. LLM 공급자를 사용하여 OpenShift Lightspeed를 구성하고 사고 감지 MCP 서버를 추가합니다. 공식 문서를 따르거나 OpenAI 공급자용으로 미리 구성된 다음 YAML 파일과 명령을 사용할 수 있습니다.

oc apply -f - <<EOF
apiVersion: ols.openshift.io/v1alpha1
kind: OLSConfig
metadata:
  name: cluster
spec:
  featureGates:
  - MCPServer
  llm:
    providers:
    - name: myOpenai
      type: openai
      credentialsSecretRef:
        name: credentials
      url: https://api.openai.com/v1
      models:
      - name: gpt-4.1-mini
  mcpServers:
  - name: cluster-health
    streamableHTTP:
      enableSSE: false
      sseReadTimeout: 10
      timeout: 5
      url: 'http://cluster-health-mcp-server.openshift-cluster-observability-operator.svc.cluster.local:8085/mcp'
  ols:
    defaultModel: gpt-4.1-mini
    defaultProvider: myOpenai
EOF

7. 구성을 적용하는 데 몇 분 정도 소요됩니다. 완료되기 전에 채팅을 열면 “Waiting for OpenShift Lightspeed service”이라는 경고 메시지가 표시됩니다 .

Lightspeed 채팅에서의 사고 분석

인시던트 감지 MCP 서버가 설치되면 대화와 관련된 인시던트 데이터가 채팅 컨텍스트에 포함됩니다. 인시던트 감지 MCP 도구는 일반적으로 “cluster health”, “alerts”, “issues”, 그리고 물론 “incidents”와 의미적으로 관련된 문구에 의해 트리거됩니다.

예를 들어, 다음과 같이 질문할 수 있습니다.

Are there incidents firing?

또는 이러한 질문의 변형된 형태입니다. 현재 사고가 발생 중인 경우, 대응에 보고서가 포함됩니다(그림 3).

사고 보고서
그림 3: OpenShift Lightspeed는 현재 발생 중인 3가지 중요 사건을 요약한 것입니다.

MCP 도구가 호출되면 get_incidents 응답 아래에 레이블이 표시됩니다. 이 레이블이 표시되지 않으면 LLM이 어떤 이유로든 도구를 호출하지 않기로 결정했음을 의미합니다. LLM은 결정적이지 않습니다. 모델 버전, 사용 가능한 MCP 서버, 현재 상황, 대화 기록 등 여러 요소를 기반으로 MCP 도구 함수를 호출할 시점을 결정합니다. 인시던트 데이터가 포함되도록 하려면 질문에 “incident”라는 단어를 추가해 보세요.

LLM은 명시적으로 요청하지 않은 프롬프트에서도 인시던트 데이터를 간접적으로 사용할 수 있습니다. 예를 들어, 다음 프롬프트는 인시던트 데이터를 사용하여 보고서를 생성할 수 있습니다.

I'm seeing KubeAPITerminatedRequests in the alerts. Analyze the incident and tell me what's happening

또 다른 사용 사례는 증상부터 시작하여 LLM에 근본 원인을 찾도록 요청하는 것입니다.

Why is [component/service/...] down?

대화에서 사건이 언급되면 채팅에서 직접 세부 정보를 요청할 수 있습니다(예: 그림 4에서처럼 “사건 X에 대해 설명해 주세요”). 또는 Observe → Incidents 페이지를 참조하여 요청할 수 있습니다. 사건 페이지로 바로 연결되는 링크가 대화에 포함되어 있는 경우도 있지만, 사용 중인 언어 모델에 따라 다릅니다.

사건에 대한 세부 정보 얻기
그림 4: 특정 사건에 대한 세부 정보 요청.

보안 고려 사항

인시던트 감지 MCP 서버는 읽기 전용 구성 요소이며, 현재 로그인한 사용자가 OpenShift 웹 콘솔에서 볼 수 있는 데이터에만 액세스할 수 있습니다. 사용자에게 클러스터 내 Prometheus 및 Alertmanager를 쿼리할 수 있는 권한이 없는 경우, OpenShift Lightspeed는 인시던트 데이터에 액세스할 수 없습니다.

사고 감지 MCP는 OpenShift Lightspeed에서만 사용하도록 설계되었습니다. 사용자 지정 인증 헤더가 필요하기 때문에 일반 MCP 클라이언트에서는 사용할 수 없습니다. MCP 서버의 인증 표준이 계속 발전하고 아직 완전히 정의되지 않았기 때문에 향후 변경될 수 있습니다.

다음은 무엇입니까?

저희는 AI 기반 대응의 질을 향상시키기 위해 적극적으로 노력하고 있으며, 더욱 풍부한 사고 분석을 제공하기 위해 더욱 다양한 신호를 통합할 계획입니다. LLM 및 MCP 표준이 계속 발전함에 따라 이 도구도 발전할 것입니다.

이 개발자 프리뷰 릴리스의 일환으로, 바로 직접 체험해 보실 수 있습니다. 기능을 살펴보고 여러분의 워크플로에 어떻게 적용되는지 확인해 보시기 바랍니다. 이 과정에서 여러분의 피드백은 매우 중요하며, Red Hat OpenShift 피드백 양식을 통해 아이디어, 질문, 그리고 권장 사항을 공유해 주시기 바랍니다 .

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like