플래시-투-플래시-투-클라우드(F2F2C) – 테이프가 사라진 이유

플래시-투-플래시-투-클라우드 – 테이프가 (마침내) 사라진 이유

플래시를 백업에 사용한다? 이상하게 들리지 않나요? 솔직히 말하면 저희도 고성능 데이터 허브인 플래시블레이드(FlashBlade)를 구매해 백업에 사용하는 고객들이 있다는 이야기를 들었을 때 그렇게 생각했습니다. IT 예산에서 가장 전략적이지 않은 것으로 간주되는 백업은 고객들이 플래시블레이드(FlashBlade)에서 실행하는 데이터 웨어하우스, 데이터 레이크, 스트리밍 애널리틱스와 AI 클러스터와 같은 다른 애널리틱스 워크로드와 잘 어울리지 않아 보였습니다.

그러나 이는 백업을 위해 플래시를 사용하는 것이 다소 이해가 되지 않는다는 저희의 생각을 바꾸었을 뿐만 아니라 현재 백업 시장이 플래시와 클라우드가 혁신적인 역할을 할 수 있는 변곡점에 와 있다는 것을 깨닫게 해주었습니다. 이전에는 백업이 최소한의 비용으로 복사본을 유지하는 것에 초점을 맞췄다면, 이제는 어떻게 데이터를 활용하게 할 것인지로 변화했습니다. 즉, 관점이 단순 복구에서 실제 가치를 창조하는 것으로 변화한 것입니다.

백업을 플래시로?

그렇다면 고객들은 왜 플래시를 백업에 사용하기 시작했을까요? 플래시의 성능이 필요했던 걸까요? 백업에 플래시를 사용하기엔 너무 비싸지 않나요? 자세히 보니 고객들은 플래시를 백업 자체에 사용한 것이 아니라 복구에 활용하고 있었습니다. 고객들은 플래시를 활용해 재난 복구(DR), 테스트/개발에서 백업 데이터의 용도를 변경하고, 클라우드에서 백업 데이터를 재사용했습니다.

지난 10년 간 고객들은 완벽한 데이터 보호 열풍에 휩싸여 있었습니다. 데이터세트가 테라바이트에서 페타바이트, 그리고 그 이상으로 증가하면서 데이터의 대폭발(Cambrian explosion)이 일어났습니다. 동시에 플래시가 등장해 데이터센터의 새로운 성능 기준을 만들었습니다. 데이터의 중요성이 커지고 있으며, 데이터는 많은 현대 비즈니스의 기반이 되고 있습니다. 이 모든 요인들로 인해 이전에는 크리티컬한 워크로드에만 국한되던 높은 수준의 RTO가 대부분 생산 워크로드의 새로운 기준이 되었습니다.

그러나 그 결과로 백업, 더 나아가서는 복구 SLA(서비스 수준 계약)를 충족시킬 수 없게 되었습니다. 많은 고객들이 이러한 문제를 겪고 있습니다. 오늘날의 백업 성공률은 75~85%이며 백업이 성공적으로 되었다 하더라도 복구의 20%가 비즈니스 RTO(목표 복구 시간)를 충족시키지 못하고 있습니다. 저희 고객을 포함한 많은 사람들이 사용하던 디스크-투-디스크-투-테이프(Disk-to-Disk-to-Tape, 이하 D2D2T) 백업은 더 이상 오늘날 보호해야 할 지속적인 데이터 흐름과 고급 데이터를 감당할 수 없게 되었습니다. 이전 모델을 간단하게 조정함으로써 일시적으로 문제를 유예할 수는 있으나 근본적인 문제 해결은 불가능합니다.

더 이상 성공할 수 없는 디스크-투-디스크-투-테이프

많은 고객들이 사용하는 백업 아키텍처에는 디스크, 테이프 모두가 포함됩니다. D2D2T 백업 전략에서는 데이터 사본이 먼저 디스크 기반 백업 어플라이언스에 저장되고, 또 테이프에도 저장됩니다. 디스크 사본이 있기 때문에 테이프만 단독으로 사용했을 때보다 더 나은 복구 성능을 제공할 수 있습니다. 그러나 디스크가 테이프보다 비싸기 때문에 백업 어플라이언스는 중복제거를 통해 상대적으로 비용 효과적인 디스크 기반 백업 솔루션을 제공합니다. 물론 중복 제거된 디스크도 테이프만큼 비용이 저렴하지 않지만 관리 개선 효과로 비용 차이를 충분히 합리화할 수 있습니다. D2D2T 방식은 백업 어플라이언스로부터의 빠른 데이터 복구를 제공했고, 장기 보유에는 테이프를 활용했습니다.

D2D2T는 테이프가 가지고 있던 몇 가지 관리상 문제를 해결해주었습니다. 복구를 위해 더 이상 테이프를 찾아 다닐 필요가 없어졌으며, 완전한 세트를 갖췄는지 걱정할 필요가 없어졌습니다. 그리고 백업 어플라이언스가 백업본 저장에 디스크를 사용했기 때문에 복구 시간이 개선되어 테라바이트 크기의 데이터세트를 몇 시간 이내에 복구할 수 있었습니다.

이는 이전 방식들에 비하면 백업을 크게 현대화 했지만 백업 어플라이언스 관리의 새로운 문제점을 드러내기도 했습니다. 바로 성능 및 용량 확장이 잘 안 된다는 점입니다. 어플라이언스가 가득 차면 새로 구매를 해야 하고, 새로 구입한 어플라이언스도 꽉 차면 또 새로운 것을 구매해야 합니다. 이렇게 새롭게 어플라이언스를 추가할 때마다 중복제거, 관리 영역이 더 늘어나 비효율적이게 됩니다.

다른 무엇보다 가장 중요한 것은 대다수의 백업 어플라이언스가 테이프보다는 빠르지만 데이터를  복구할땐 비효율적이라는 점입니다. 백업 어플라이언스들은 데이터를 가장 빠르게 백업하도록 개발되었지만, 복구 성능은 부차적인 것으로 여겨졌습니다. 최대한 빠른 복구를 위해서는 주기억장치가 데이터를 사용할 수 있는 속도로 데이터를 제공할 수 있어야 합니다. 그러나 어플라이언스 디스크가 점점 찰수록 복구 속도가 더뎌져 효율적으로 시스템을 운영하는 것이 어려워집니다.

영화 ‘가디언즈 오브 갤럭시’ 등의 흥행과 옛 것에 대한 향수로 최근 오디오 테이프 판매가 급증하여 2017년에는 136%의 성장세를 보였습니다. 아무리 복고가 대세라지만 바쁜 IT 관리자들이 느긋하게 앉아 데이터가 천천히 복구되길 기다리는 일은 없을 것입니다.

백업 그리고 복구에서 플래시가 디스크를 대체하는 이유

플래시는 회전식 디스크에 비해 월등한 성능을 제공합니다. 고성능의 플래시 백업과 복구 속도는 올플래시 생산 시스템의 속도와 비슷해 생산 시스템이 데이터를 소비하는 속도로 복구가 가능합니다. 또한 플래시 백업은 동시다발적으로 더 많은 서버 백업을 할 수 있어 활용도가 좋습니다. 그리고 데이터 절감 기술까지 갖춘 플래시를 사용하면 더 경제적일 뿐만 아니라 더 우수한 복구 성능을 얻을 수 있습니다. 대세는 플래시-투-플래시입니다.

퓨어스토리지 플래시블레이드(FlashBlade)는 높은 대역폭을 갖춘 차세대 플래시 플랫폼으로 백업 및 빠른 복원을 포함한 다양한 워크로드에 혁신적인 성능을 제공합니다. 경쟁 제품과 달리 플래시블레이드(FlashBlade)에서는 복구 성능이 백업 성능을 능가합니다. 75개의 블레이드로 구성된 플래시블레이드(FlashBlade)의 피크 백업 성능은 시간당 90테라바이트이며 복구 성능은 이보다 3배 높은 초당 75기가바이트입니다. 참고로 이 성능은 랙 20대만을 기준으로 한 것입니다.

플래시어레이(FlashArray) 스냅샷은 플래시블레이드(FlashBlade)에 바로 백업되어 저장될 수 있으며, 스냅샷 메타데이터가 스냅샷에 캡슐화되는 새로운 스냅샷 타입인 포터블(portable) 스냅샷을 통한 빠른 복구에 사용될 수 있습니다. 즉, 어디에나

플래시블레이드(FlashBlade)를 통한 빠른 복구

고객들이 데이터 보호에 플래시블레이드(FlashBlade)를 어떻게, 왜 사용하는지를 알게 된 후 저희는 모든 주요 데이터베이스를 지원할 신속한 복구 솔루션뿐만 아니라 기존 그리고 신규 데이터 보호 벤더들과의 솔루션을 만들었습니다. 이는 하나의 솔루션이 아닙니다. 서로 다른 10여 가지의 백업/복구 활용 사례로 구성되어 있는 솔루션으로 점점 더 많은 사례들이 추가되고 있습니다.

데이터베이스를 위한 신속한 복구 솔루션은 빠릅니다. 매우 빠릅니다. 하나의 플래시블레이드(FlashBlade)는 백업 시 시간당 15테라바이트, 복구 시에는 시간당 약 50테라바이트를 지원할 수 있습니다. 플래시블레이드(FlashBlade)에서의 오라클 RMAN 백업은 약 3:1의 데이터 절감률을 보이고, DB관리자는 몇 분 혹은 몇 시간 이내에 데이터베이스 복구를 완료할 수 있습니다.

또한 저희는 플래시블레이드(FlashBlade)를 기존 데이터 보호 소프트웨어의 타깃으로 활용해 적은 공간으로 더 나은 성능을 제공합니다. 플래시블레이드(FlashBlade)의 빌트인 압축 기능을 중복제거, 복제, 클라우드 티어링 등의 데이터 보호 파트너들의 기능들로 보완해 사용자들은 성능, 용량, 복원성에 맞게 백업 인프라스트럭처를 최적화할 수 있습니다.

완벽한 현대적 솔루션을 위한 플래시-투-플래시-투-클라우드(Flash-to-Flash-to-Cloud, F2F2C)

그러나 또 다른 백업 문제가 있습니다. 고객들이 신속한 복구에 플래시블레이드(FlashBlade)를 효과적으로 사용하고 있었지만 컴플라이언스와 보존을 위해 방대한 양의 데이터를 오프사이트에 저장해야 했으며, 이를 위해 테이프를 계속 사용했습니다. 이미 언급한 바와 같이 테이프는 복잡하고 느립니다. 그러나 이보다 더 큰 테이프의 문제는 데이터가 오프라인 어딘가에 갇히게 되어 기업에 아무런 가치를 제공하지 못한다는 것입니다.

해결책은 테이프를 아마존 S3(Amazon S3)와 같은 저비용의 클라우드 오브젝트 스토리지로 교체하는 것입니다. 이것이 바로 새로운 플래시-투-플래시-투-클라우드(F2F2C) 백업 패러다임입니다. 고객들의 새로운 백업 패러다임으로의 여정을 가속화하기 위해 퓨어스토리지는 고객들에게 몇 가지 다른 솔루션을 제공하고 있습니다. 클라우드스냅(CloudSnap)은 퓨어스토리지 플래시어레이(FlashArray)에 내장되어 다른 플래시어레이(FlashArray), 플래시블레이드(FlashBlade), NFS 기기 혹은 클라우드에 직접 포터블(portable) 스냅샷 기능을 제공합니다. 퓨어스토리지는 최근에 클라우드 오브젝트 스토리지 구조로 클라우드 전반에서 대규모 비정형화 데이터의 관리를 담당하는 스토어리듀스(StorReduce)를 인수했습니다. 2019년에 퓨어스토리지는 클라우드 최초의 스토어리듀스(StorReduce) 스케일-아웃 데이터 최적화 기술을 활용해 고객들이 비용 효과적인 하이브리드 클라우드와 클라우드 네이티브 복구 솔루션을 만들 수 있도록 할 것입니다.

플래시와 클라우드 기반의 데이터 보호 플랫폼 퓨어스토리지 오브젝트엔진(ObjectEngine)을 소개합니다.

최근 퓨어스토리지는 업계 최초의 ‘플래시-투-플래시-투-클라우드(F2F2C)’ 플랫폼인 퓨어스토리지 오브젝트엔진(Pure Storage ObjectEngine)을 발표했습니다. 오브젝트엔진(ObjectEngine)은 데이터 보호의 현대화를 위하여 플래시와 클라우드에 기반하고 있습니다. 또한 ‘디스크-투-디스크-투-테이프(D2D2T)’ 방식의 구형 아키텍처와는 달리 신속한 복구, 클라우드 경제학에 근거한 비용 절감, 그리고 GDPR, 분석, 인공지능과 같은 기업의 새로운 부가 가치 창출을 위해 데이터를 유연하게 활용할 수 있는 등의 장점을 가지고 있습니다.

오브젝트엔진(ObjectEngine)은 오브젝트엔진//A(ObjectEngine//A)와 오브젝트엔진 클라우드(ObjectEngine Cloud) 두 가지 제품으로 구성됩니다. 오브젝트엔진//A(ObjectEngine//A)는 운영 애플리케이션 환경에 대한 백업을 수행하는 백업 소프트웨어와 백업된 데이터를 저장하는 오브젝트 스토리지 사이에 위치한 온-프레미스 시스템으로, 인라인 데이터 중복제거와 암호화를 성능저하 없이 제공하여 스토리지 및 데이터 전송 비용을 최대 97%까지 낮춥니다. 플래시블레이드(FlashBlade) 스케일-아웃 시스템은 올플래시 오브젝트 스토리지를 기반으로 이미 빠른 복구 속도를 자랑하지만, 오브젝트엔진//A(ObjectEngine//A)와 함께 사용되면 복구시간목표(RTO)를 더 낮추어 재해 발생시 데이터의 신속한 복구가 가능해집니다. 오브젝트엔진//A(ObjectEngine//A)는 2019년 1분기에 공식 출시될 예정입니다.

오브젝트엔진//A(ObjectEngine//A)를 구성하는 기본 클러스터는 클라우드 네이티브 스케일-아웃 아키텍처를 기반으로 백업 최대 25 TB/hr와 데이터 복구 최대 15 TB/hr의 속도를 자랑합니다. 오브젝트엔진//A(ObjectEngine//A)은 온-프레미스 오브젝트 스토리지, 퍼블릭 클라우드, 하이브리드 클라우드에서 하나의 네임스페이스로 수백 페타바이트(PB)의 데이터를 관리할 수 있습니다. 이를 통해 멀티 클라우드 환경에서 데이터를 통합하여 데이터 사일로를 없애고, 업무 환경을 개선하여 기업이 새로운 가치를 창출하기 위한 최적의 데이터 관리 환경을 제공합니다.

오브젝트엔진 클라우드(ObjectEngine Cloud)는 클라우드 네이티브 소프트웨어 제품으로 퍼블릭 클라우드에서의 스케일-아웃 기능을 제공합니다. 기업들은 오브젝트엔진 클라우드(ObjectEngine Cloud)를 통해 기업의 새로운 부가가치 창출을 위한 데이터 재사용 환경을 SaaS(Solution-as-a-Service) 기반으로 사용할 수 있습니다. 해당 제품은 2019년 하반기에 공식 출시될 예정입니다.

콜드 데이터를 재사용할 수 있도록 합니다.

고객이 백업 데이터를 클라우드에 저장하면, 이 데이터를 마이그레이션, 개발/테스트, 분석 등을 위하여 어떻게 재사용 할 수 있을지 생각하게 될 것입니다. 오브젝트엔진 클라우드(ObjectEngine Cloud)는 클라우드를 기반으로 설계되었기 때문에 클라우드 버전의 백업 소프트웨어를 이용하여 온전히 클라우드 내에서 데이터 복구를 수행할 수 있습니다. 앞으로는 고객의 데이터를 퓨어의 고성능 블록 스토리지 서비스인 클라우드 블록 스토어(Cloud Block Store) 혹은, 고객이 선호하는 AWS의 데이터 서비스에 복구할 수 있도록 할 예정입니다. 마치 어느 금고 안 테이프에 저장되어 있던 콜드 데이터를 기업의 새로운 부가가치 창출을 위한 자원으로 활용하는 것과 같습니다.

자세한 사항

퓨어스토리지가 오브젝트엔진(ObjectEngine)을 통하여 어떻게 고객으로 하여금 클라우드 경제학을 기반한 데이터 보호 플래시-투-플래시-투-클라우드(F2F2C) 백업 전략을 이행하도록 지원하며, 더 신속한 복구 및 관리 비용의 절감을 가능케 하는지 확인해 보세요. 또한, 포브스(Forbes)의 스티브 맥도웰(Steve McDowell)이 오브젝트엔진(ObjectEngine)에 대하여 쓴 기사도 참고 부탁드립니다.