얼마 전 스마트폰이 고장 났는데, 다행히 근처 통신사에 가서 다른 스마트폰을 구입하며 쉽게 교체했습니다. 그런데, 중요한 출장을 코앞에 두고 이 스마트폰이 또 고장이 났습니다. 저장된 데이터는 어떻게 해야 할까요? 데이터를 복구할 시간이 없었기 때문에 필요한 데이터만 먼저 선택하기로 했습니다. 저에게 가장 중요한 데이터는 어떤 데이터일까요? 연락처? 이메일? 은행 앱? 회사 앱? 소셜 미디어 앱? 음식배달 앱? 수천장의 사진들?

정답은 위에 나열된 데이터 전부입니다. 그래서 당장 필요한 핵심 데이터를 복구한 후, 나머지는 나중에 따로 시간을 내어 복구를 했습니다.

이 시나리오가 여러분과 여러분이 근무하는 조직에 어떻게 대입해볼 수 있을지 생각해보십시오. 물론 훨씬 큰 규모겠죠? 일부 데이터는 ‘미션 크리티컬’ 이라, 이 데이터들이 없다면 비즈니스에 지장이 생기고, 매출, 고객, 그리고 브랜드 신뢰도 측면에서 상당한 손해가 발생할 것입니다. 애플리케이션의 다운타임이 미치는 영향을 연구한 엔터프라이즈 스트레티지 그룹(Enterprise Strategy Group, ESG)의 최근 조사에 따르면1, 애플리케이션의 다운타임이나 데이터 손실로 가장 큰 타격을 입는 것은 매출인 것으로 나타났습니다.

Enterprise-SLA-expectation
이미지 출처: [웨비나] 데이터만 동기하는 것은 과거의 솔루션 퓨어스토리지는 서비스까지도 동기화합니다 @퓨어스토리지 유튜브 채널

 

규모와 비용은 그렇다고 해도, 외부 위협 또한 무시할 수 없는 문제입니다. 업그레이드 실패, 직원의 실수 등 기존의 IT 위협은 폭발적으로 증가하는 데이터와 이를 관리해야 하는 내부인원 부족 문제와 더불어 잠재적인 위협을 증가시킵니다. 또한 사이버 범죄의 증가, 예측 불가한 기후변화 등의 주요 문제들과 이전에는 없었던 새로운 위협들이 경쟁하듯 생겨나고 있습니다.

배경 또한 고려하지 않을 수 없습니다. 디지털 트랜스포메이션으로, 고객들은 자신과 비즈니스하는 기업들에 대한 기대치가 상당히 높으며, 애플리케이션을 1년 365일 사용할 수 있길 원할뿐 아니라, 빠른 응답과 커스터마이징 된 경험을 기대합니다.

과연 이것이 엔터프라이즈 데이터 보호 전략에 어떤 의미일까요?

백업보다는 복구

조직들은 백업에서 복구가 중요하다는 인식전환을 해야 합니다. 백업에 대해 많은 생각을 하는 게 당연합니다. 백업되는 데이터가 복구되는 데이터보다 많으니까요. 그러나, 데이터의 비즈니스 가치와 다운타임 비용이 늘어나고 있음을 고려할 때, 복구가 백업보다 더 중요합니다.

만병통치약은 없다

조직은 미션 크리티컬 데이터와 이러한 데이터를 사용하지 못하게 된 경우 발생하는 비용을 파악하고, 복구 서비스 수준 협약(SLA)을 충족할 수 있는 다양한 기술들을 평가해야 합니다.

데이터 보호에서 백업 소프트웨어가 수행하는 핵심적인 역할

오랜 세월 동안 백업 솔루션은 엔터프라이즈 데이터 보호의 중추 역할을 했습니다. 시간이 지나면서 관리와 카탈로깅을 수행하는 컨트롤플레인으로 진화했고 서드파티 솔루션과 통합이 되었습니다.

백업 기술

애플리케이션의 복구 SLA를 충족하는데 도움을 주는 많은 기술들이 존재합니다. 엔터프라이즈 데이터 보호 전략은 비즈니스가 각 애플리케이션에 요구하는 SLA를 정의하고 이를 올바른 백업 기술과 매치시켜 줍니다.

구현 가능한 기술 몇 가지를 소개하기 전에, 시중에 나와 있는 기술들의 백업 기능과 공통적인 용어를 살펴보도록 하겠습니다.

  • 복구 시점 목표(RPO): 데이터 손실을 얼마나 감당할 수 있는가를 의미하며, 심각한 피해가 발생하기까지 감내할 수 있는 데이터 손실 양”.²
  • 복구 시간 목표(RTO): “비즈니스에 심각한 피해 없이 서비스가 재개될 때가지 걸리는 시간.²

 

복제 기술: 스토리지 공급업체들이 복제 기술을 제공하기 시작한지는 꽤 오래되었습니다. 이 기술은 스토리지 운영 중에 데이터를 복사하여 복사본을 다른 위치에 있는 스토리지로 전송할 수 있도록 해줍니다. 애플리케이션들을 위한 통합도 제공되어, 장애가 발생하는 경우 애플리케이션이 복사본을 사용할 수 있도록 합니다.

 

하드웨어 스냅샷: 하드웨어 공급업체들은 애플리케이션의 복구 가능한 복사본을 신속하게 제공합니다. 클론이라고도 알려진 스냅샷은 애플리케이션의 성능에 거의 영향을 주지 않고 몇 초 만에 생성될 수 있으며, 보통 스냅샷이 이뤄지는 스토리지 어레이에 연결이 되어 있습니다.

하루 중에 여러 차례 스냅샷을 생성할 수 있기 때문에 복구 시점 목표를 크게 향상시켜 줍니다. 일례로, 미션 크리티컬 데이터베이스의 복사본은 매시간마다 백업이 가능합니다. 한 시간 전 데이터까지 복구할 수 있다는 말입니다. 또한 스냅샷으로 라이브 데이터를 교체함으로써 복구 시간 목표를 가속화할 수도 있습니다.

 

디스크 기반 백업: 디스크 기반 백업은 지난 몇 년 동안 사용되어 왔습니다. 그러나 2000년대에 보다 비용 효율적인 SATA 디스크가 등장하면서 활용도가 급격히 늘었습니다. 이는 조직들이 백업을 디스크로 먼저 보냈다가, 장기적으로 저장하기 위해 테이프로 이동하는 ‘디스크 스테이징’을 도입할 수 있게 해주었습니다.

 

디스크 기반 백업 어플라이언스 

백업에 SATA 디스크 사용이 늘어난 후, 2000년대 중반에서 후반 사이 PBBA(전용 어플라이언스)로 인해 백업 환경이 와해되었습니다. 이 어플라이언스들은 중복제거를 통해 (고유한 특정 데이터만 저장) 저장이 필요한 백업 데이터를 감소시켜 주고 원격 사무실을 보호 (고유한 특정 데이터만 보냄) 할 수 있도록 해주었습니다. 이후에 완전한 턴키 솔루션으로 나온 어플라이언스에는 백업 소프트웨어도 포함되었습니다.

 

테이프

테이프 기술은 오랫동안 엔터프라이즈 데이터 보호에서 중추적 역할을 수행했습니다. 백업 어플라이언스가 나오기 전, 데이터는 네트워크를 통해 1차 스토리지에서 테이프로 쓰게 되었습니다. 보통은 테이프를 복사해 1개 이상의 복사본을 다른 위치에 있는 오프사이트로 보냈습니다. 백업 어플라이언스가 보편화되면서, 테이프는 재해 복구용 복사본을 만드는데만 사용되었습니다.

 

퍼블릭 클라우드 

퍼블릭 클라우드의 가장 보편적인 사용 사례 중 하나는 백업 데이터의 장기 저장소 역할을 하는 것입니다. 백업 소프트웨어 공급업체들은 백업 데이터를 클라우드로 보내 저장할 수 있도록 퍼블릭 클라우드 공급업체들과 다양한 통합 계층을 구축했습니다. 퍼블릭 클라우드는 재해 복구 복사본을 제공하는 수단으로서의 테이프를 대체하고 있습니다.

조직들이 데이터 보호 요구사항을 충족하는데 도움을 주는 몇 가지 기술들이 존재합니다. 그러나 451 Research에 따르면, 조직들의 지속적인 주요 관심사는 복구입니다. 무엇보다 중요한 것은, 데이터 웨어하우스, 분석, AI 애플리케이션 등 비핵심 워크로드에 대해서도 데이터 복구에 대한 기대치가 상당히 높다는 것입니다. 그 이유 중 하나는 조직들이 데이터가 어떤 경쟁력을 제공할 수 있는지 실제로 확인할 수 있게 되었기 때문입니다.

조직들이 비즈니스를 수행하는데 뿐만 아니라 분석과 머신러닝을 통해 경쟁력을 확보하는데도 데이터를 활용하는 경우가 증가하면서, 데이터 복구 역량은 그 어느 때보다 중요해지고 있습니다. 데이터 복구를 지원할 수 있는 많은 다양한 기술들이 존재하지만, 각 기술이 엔터프라이즈 데이터 보호 전략에서 어떤 역할을 수행할 수 있는지 먼저 이해하는 것이 중요합니다.

전체적인 복구 역량을 향상시키기 위해 엔터프라이즈 데이터 보호 전략을 대대적으로 수정할 계획이신가요? 고객들이 필요로 하는 수준의 복구 능력을 제공할 수 없다는 것이 조직에 어떤 영향을 미치는지 궁금하신가요?

451 Reseach의 최신 보고서와 아래 영상을 통해, 퓨어스토리지가 제공하는 솔루션과 전략을 알아보세요.

참고 자료 

1. ESG, Christophe Bertrand “Crossing the Data Management Chasm: From DR to Data Intelligence”

2. https://www.enterprisestorageforum.com/storage-management/rpo-and-rto-understanding-the-differences.html

3. 451 Research Group “Data recovery matters even for non critical workloads