image_pdfimage_print

고객들은 오늘날의 디지털 솔루션에서 성능, 가용성, 사용 편의성 등 많은 것을 기대합니다. 이 때문에 대부분의 서비스 공급업체들은 서비스의 품질과 고객 경험의 기준에 대해 많은 고민을 하고, 이러한 기준을 유지하는 데 도움이 되는 SLA, SLO, SLI를 설정합니다.

  • 서비스수준협약(SLA, Service level agreement):고객이 공급업체의 솔루션을 사용할 때 기대할 수 있는 최소 수준의 성능, 가용성 및 기타 지표
  • 서비스수준목표(SLO, Service level objectives):공급업체가 이러한 SLA를 충족하기 위해 달성하고자 하는 내부적인 목표
  • 서비스수준지표(SLI, Service level indicators): 공급업체가 실제로 SLO와 SLA를 모두 충족시키는 데 얼마나 근접했는지 측정하는 데 사용하는 지표

이 세 개념은 모두 사이트 안정성 엔지니어링(SRE)의 중요한 부분이며, SRE는 시스템 성능, 안정성 및 기타 요소에 대한 목표를 설정하고 모니터링하는 데 사용되는 프로세스 서비스를 제공합니다.

각 개념을 좀 더 자세히 살펴보겠습니다.

서비스수준협약(SLA)이란?

SLA는 고객에게 하는 약속입니다. 이는 고객과 서비스 공공업체가 아무리 원한다고 해도 100%의 가용성과 안정성을 제공하는 서비스는 없다는 가정을 기반으로 합니다. 따라서 다음과 같은 질문을 해야 합니다.

  • 시스템이 얼마나 가용할 것인가? 고객은 몇 퍼센트의 가용성을 기대할 수 있는가?
  • 시스템이 다운되면 팀은 어떤 조치를 취할 것인가?
  • 문제가 얼마나 빨리 해결되는가?
  • 속도나 특정 기능에 대해 어떤 보증을 제공할 수 있는가?

이런 것들이 SLA에서 다루는 정보입니다. 서비스 제공업체와 고객 간에 서비스의 성능, 가용성 및 기타 측면에 대해 사전에 정의되고 합의된 기준을 준수하기 위한 일종의 계약이라고 할 수 있습니다.

SLA의 또 다른 중요한 부분은 어느 시점에서 정해진 기준이 충족되지 않는다면 어떤 결과를 초래하는가를 정하는 것입니다. 이러한 결과에는 리베이트나 환불, 무료 라이선스 연장 또는 기타 패널티가 포함될 수 있습니다.

SLA 모범 사례 

  • 기술 팀이 SLA 작성에 참여해야 합니다.고객을 만족시키고 현실적이면서 달성 가능한 효과적인 SLA를 생성하려면 기술 팀이 SLA 작성에 참여해야 합니다. 법률 팀이나 비즈니스 개발 임원들이 SLA를 작성하는 경우가 많은데, 이들은 문제 진단과 해결은 물론 일상적인 서비스 운영과 유지 관리를 감독하지 않습니다. IT 및 데브옵스(DevOps) 팀(영문자료)은 측정 가능하고 달성 가능하며 실제 비즈니스 우선 순위에 부합하는 SLA가 구축될 수 있도록 적극 참여해야 합니다.
  • SLA에는 고객의 선호도가 반영되어야 합니다.SLA는 고객의 기대치를 충족하고, 고객에게 가장 중요한 사항에 초점을 맞춰야 합니다. 고객이 알아차리지 못하는 서비스 성능이 있을 수도 있겠지만, 이러한 성능은 SLA에 포함되지 말아야 합니다.
  • SLA를 간결하게 유지하고 명확한 언어를 사용해야 합니다. 간단함을 유지한다는 것은 높은 수준의 서비스를 제공하고, 실제 사용자의 기능에 중점을 두어야 한다는 의미입니다. 예를 들어, 99.5%의 시스템 가용성을 유지하는 것이 SLA 중 하나라면 백엔드에서 이러한 가용성을 지원하는 데 어떤 수많은 작업이 필요한지나 세부적인 요구사항이 추가될 필요가 없습니다. 그리고 고객이 사전에 완전히 이해하지 못한 부분에 문제가 발생할 수도 있으므로 반드시 명확한 용어를 사용해야 합니다.

에버그린 서비스형 스토리지에 대해 자세히 알아보세요.

서비스수준목표(SLO)란?

SLO는 SLA를 충족하기 위해 달성해야 하는 목표입니다. 이러한 목표의 구체적인 항목은 응답 시간, 시스템 가용성, 솔루션 성능 등이 될 수 있습니다. SLA는 고객과 체결하는 공식적인 계약이며, SLO는 해당 고객에게 약속하는 품질, 성능 및 기타 요소의 개별적인 기준 또는 수준입니다.

SLO는 고객이 기대할 수 있는 ‘수치’이며, IT 팀과 데브옵스 팀이 이를 목표로 삼을 수 있습니다. IT 팀이 ‘SLA를 위반’하기 전에 문제에 대응할 수 있는 시간을 확보하기 위해, SLO는 SLA보다 다소 엄격한 경우가 많습니다. 예를 들어, SLO는 99.7%의 가동 시간을 보장하고, SLA는 99.5%를 보장하는 등입니다. 그래야 시스템이 다운될 경우, 패널티나 기타 대가를 치러야 하는 99.5%의 계약 위반이 발생하기 전에 문제를 서둘러 해결할 수 있습니다.

SLO 모범 사례

  • SLO 간단 명료해야 합니다. IT 또는 시스템 엔지니어가 어떤 것을 기대해야 하며, 어떻게 이러한 표준을 달성하고 유지하는지 완전하게 이해하는 것이 중요합니다.
  • SLO 모든 가능한 문제를 고려해야 합니다.SLA와 SLO와 관련된 공통적인 문제 중 하나는 서비스 공공업체가 제공할 서비스를 개괄적으로 설명할 뿐, 운영 중단이나 기타 문제에 대한 고객 보고의 지연 상황 등을 고려하지는 않는다는 점입니다. SLO에는 SLA에서 24시간 내에 문제를 해결하겠다고 약속을 한 경우, 고객이 필요한 정보를 충분히 신속하게 제공하지 않으면 어떻게 되는지에 대한 대책 등이 포함되어야 합니다.
  • 내부 시스템에 대한 SLO 유용할 있습니다.일부 조직에서는 고객 대면 시스템뿐만 아니라 내부 네트워크나 CRM 또는 ERP 시스템에 SLO를 지정해 적용합니다. 이는 조직의 모든 직원들이 고객 서비스 등에 대해 사전 설정된 기준을 충족하는 데 도움을 줄 수 있습니다.
  • 필요 이상으로 많이 만들지 않아야 합니다. 고객에게 약속한 표준을 위한 SLO를 생성하는 것은 물론 중요하지만, 적을수록 좋은 경우가 있습니다. 고객의 성공과 만족은 단일한 지표에 달려 있지 않습니다. 가장 필요한 요소들을 SLO로 약속하면, 그 SLO를 충족하는 데만 집중할 수 있습니다.

서비스수준지표(SLI)란?

SLI는 SLO, 그리고 궁극적으로 SLA가 얼마나 충족되고 있는지 알려주는 지표입니다. 예를 들어, SLA가 99.5%의 가동 시간을 약속하는 경우, SLO는 99.5%(또는 약간 더 높음)가 되고, SLI는 실제 측정된 가동 시간이 됩니다. SLA를 준수하려면 SLI가 정해진 SLA 수치를 충족하거나 초과해야 합니다.

SLI를 추적하여 SLA 조건을 충족하거나 초과하고 있음을 고객에게 보여 주는 기록을 확보하는 것이 중요합니다. SLI를 추적하면 SLO를 충족하고 있지 않은 시기와 이유를 분석 및 확인하고, 시스템 관리를 개선하기 위해 변경이 필요한지 여부를 평가할 수 있는 데이터도 얻을 수 있습니다.

SLI 모범 사례

  • SLI는 간단하게 유지해야 합니다. SLA를 준수하는 데 직접적인 영향을 미치지 않는 사항을 추적하도록 IT 팀에 요구해서 문제를 과도하게 복잡하게 만들지 않아야 합니다.

퓨어스토리지는 어떤 SLA를 제공할까요?

SLA, SLO, SLI에서 가장 중요한 것은 탁월한 고객 경험을 제공할 수 있도록 해주는 기준을 수립하는 것입니다. 퓨어스토리지는 계획된 다운타임 제로, 가동 시간, 용량 및 성능에 대한 SLA를 제공합니다. 또한 퓨어스토리지는 업계 최초로 에너지 효율성에 대한 SLA를 제공하는 스토리지 공급업체입니다. 이를 통해 고객은 퓨어스토리지가 탄소 배출량을 줄이기 위해 최선을 다하고 있다는 확신을 가질 수 있습니다.  또한 랜섬웨어 복구 SLA는 공격 발생 후 복구 가능한 깨끗한 스토리지 환경을 보장합니다.

SLA는 퓨어스토리지가 2022년에 고객 경험 측정을 위한 업계 표준인 순고객추천지수(NPS)에서 85.2점을 획득한 비결 중 하나입니다. 이 점수는 메달리아(Medallia)가 추적하는 모든 B2B기업들 중 상위 1%에 속합니다. 일반적으로 NPS가 50점 이상이면 우수한 것으로 간주되며, 기술 기업의 평균 NPS는 60점입니다. 퓨어스토리지는 지난 7년 동안 계속 80점대의 점수를 유지해왔습니다.

이는 퓨어스토리지가 고객과의 장기적으로 윈-윈 관계를 구축하기 위해 모든 노력을 기울이고 있기 때문입니다. 퓨어스토리지는 프로세스와 제품을 개선하기 위해 고객의 의견에 귀를 기울이며, 고객의 성공과 성장을 지원하는 최고의 파트너가 되길 바랍니다.