마침내 올플래시 시스템을 데이터 백업을 위한 타깃으로 사용할 수 있는 시점에 도달했습니다! 이와 관련하여 보충 설명을 드리고자 합니다.
저는 2013년에 “플래시 드라이브를 엔터프라이즈 백업에 사용하는 날이 올까요?”라는 제목으로 블로그를 쓴 적이 있습니다. 관심이 있으신 분은 그 당시 퓨어스토리지가 플래시어레이(FlashArray™)를 출시한지 얼마되지 않았을 때의 저의 견해를 확인하실 수 있습니다. 그 때 제가 내린 결론은 극복해야 할 도전과제들이 존재하긴 하지만, 시간이 지나면 플래시 기술이 제공하는 비용 대비 혜택을 언젠가 경험하게 될 것이라는 것이었습니다. 그 당시에는 말도 안되는 소리처럼 들렸을 수도 있지만, 그 부분만큼은 제 예측이 맞았습니다.
6년이 지난 지금, 이제 저희에겐 백업 타깃으로 활용하기 완벽한 다용도 고집적 올플래시 솔루션인 퓨어스토리지 플래시블레이드(FlashBlade™)가 있습니다. 그리고 이 플랫폼은 복구와 데이터 재사용 시나리오에 사용하기에 더 효과적이어서 백업 인프라에 진정한 가치를 더해줍니다.
지난 수십 년간 스토리지 업계는 소위 ‘빠른 복구를 위해 백업 어플라이언스(Purpose-Built Backup Appliances, 이하 PBBAs)’를 판매해왔습니다. 어떤 점에서 플래시블레이드와 확연하게 차이가 날까요?
먼저, PBBA의 ‘Purpose(용도)’는 백업이지, 복구나 다른 작업이 아닙니다. 데이터를 인제스트(ingest)하도록 고안되어 주어진 일을 훌륭하게 처리합니다. (물론 랙 절반 크기에 들어가는 플래시블레이드의 인제스트 속도를 따라가려면 몇 개의 랙을 구현해야 하지만 말입니다.) PBBA는 데이터 절감에도 효과적이나, 이는 백업 소프트웨어로 대신 처리되는 경우가 많습니다. 다만, 한 가지 PBBA가 잘 못하는 작업이 있다면 그것은 바로 데이터 복구입니다.
무언가를 데이터 인제스트 목적으로만 디자인한다면, 데이터 복구가 느려지는 결과가 야기됩니다. 예시로는 저장된 전체 데이터 양을 감소시키기 위해 블록을 여러 곳으로 분산시키는 데이터 중복제거 기법을 들 수 있습니다. (이 경우 용도는 데이터 절감입니다.) 하지만 복구가 필요한 경우 데이터를 재조립해야 해서 대량의 디스크 스레싱(disk thrashing) 현상이 발생합니다. 몇 개의 작은 파일을 복구하는 경우라면 문제가 되지 않습니다. 그러나 백만 개 단위의 파일을 복구하거나 TB 규모의 데이터베이스를 복구해야 하는 경우라면, 복구가 완료되길 기다리면서 커피 한 잔 마시고 (도넛도 먹고, 낮잠도 자고, 심지어 다음날 아침밥을 먹고) 천천히 오셔도 됩니다.
위의 도표는 퓨어스토리지의 플래시블레이드와 다른 백업 어플라이언스의 기본적인 차이점을 간단하게 보여줍니다. 대부분의 어플라이언스는 플래시 스토리지 계층이 하나뿐이고, 스토리지 용량의 대부분은 회전식 디스크로 구성됩니다. 그래서 캐시가 가득차면, 스토리지 성능이 대폭 감소됩니다. 하지만 올플래시인 플래시블레이드는 다릅니다. 백업이나 복구 시에 그러한 성능 저하가 발생하지 않습니다.
PBBA에 익숙한 사용자에게는 충격적인 말일 수 있지만, 플래시블레이드는 실제로 데이터를 인제스트하는 속도보다 복구하는 속도가 더 빠릅니다. 물론, 인제스트 속도도 대단히 빠릅니다. 랙 절반 크기의 플래시블레이드는 시간 당 90TB를 인제스트하고(빠름), 시간 당 270TB를 복구합니다. 2.7TB를 잘못 타이핑한 것이 아닙니다. 정말로 시간 당 이백 칠십TB를 복구할 수 있습니다.
백업 데이터를 더 효과적으로 사용할 수 있게 해주는 플래시
한 가지 더 기억해야 할 것이 있습니다. 백업 데이터에서 더 많은 가치를 창출하려고 하는 기업들이 늘고 있습니다. 백업 풀은 복구가 필요한 경우에만 찾는 데이터의 무덤이 되어서는 안됩니다. 데이터는 잠재 가치가 무궁무진하기 때문입니다. 테스트 및 개발, 보고, 트레이닝, 그리고 데이터를 필요로 하는 절차에 입력하는 등, 가치를 증대시켜 주는 다양한 일에 활용해야 합니다.
백업 소프트웨어 공급업체들은 데이터 재사용을 위해 워크플로우를 제공하는데 익숙합니다. DB 관리자를 위해 데이터베이스 백업을 즉시 생성하거나 백업으로 VM을 구동할 수 있습니다. 그러나 여기서 문제는 이러한 기능들이 전형적인 PBBA에 맞게 확장되지 않는다는 것입니다. VM 몇 대를 구동하는데는 아무런 문제가 없지만 수백 대를 구동해야 한다면 어떨까요? 중요한 분석 작업을 위해 몇 십 개의 데이터베이스를 생성해야 한다면? PBBA는 작동을 멈춰버릴 것입니다. 왜 그럴까요?
최근 대부분의 PBBA에는 일부 캐싱 용도로 플래시 스토리지가 포함되어 있습니다. 어떻게 보면 플래시 백업 타깃이라고 말할 수도 있겠지요. 그러나 캐시 계층 아래에 저희에게 익숙한 하드 디스크를 발견할 수 있습니다. 심지어 속도도 그다지 높지 않은 디스크입니다. 캐시 계층이 다 차버리면, 성능이 주춤거리기 시작합니다. 결국, 데이터를 재사용한다는 것은 특별한 용도로 사용하기 위해 타깃 서버로 복구한다는 말입니다.
PBBA가 복구 작업을 그다지 잘 처리하지 못한다는 사실은 이미 알고 있습니다. 그러나 플래시블레이드는 다릅니다! 성능이 느린 하드 디스크가 없고 전체가 플래시로 구성되어 있습니다.
플래시블레이드의 강력한 복구 속도는 백업된 가치 있는 데이터를 재사용해 중요한 일들을 많이 할 수 있다는 말이기도 합니다. 백업 소프트웨어의 멋진 기능들을 대규모로 활용할 수 있습니다. 또한 타깃 장치 이외에 백업 환경에서 아무것도 바꿀 필요가 없습니다.
플래시블레이드는 사용자에게 즐거움을 선사하는 다른 기능들도 있습니다. 예를 들어, 내부 스위치 구조를 통해 데이터센터 케이블 작업을 간소화해줍니다. 이 내용은 다음에 다루도록 하겠습니다.
올플래시 비용이 너무 높지 않나요?
많은 분들이 궁금해하실 겁니다. “백업에 올플래시를 사용하려면 비용이 너무 많이 들지 않나요?” 질문에 대한 대답은 ‘그렇지 않다’입니다.
퓨어스토리지는 비용 문제도 해결을 했습니다. 특히 총소유비용(TCO)측에서 더욱 그렇습니다. 초고속 복구 SLA를 요구하거나 재사용을 원하는 데이터가 포함된 특정 백업 워크로드에만 플래시블레이드의 역량이 필요할 수도 있겠지만, 어디에서든지 일단 시작을 하는 것이 중요합니다.
플래시블레이드는 고속 프라이머리 파일 스토리지로의 역할도 수행할 수 있기 때문에, PBBA의 기술적 정의에는 맞지 않습니다. 그렇지만 저는 플래시블레이드를 ‘퓨어의 더 나은 백업 어플라이언스(Pure Better Backup Appliance)’ 라는 의미에서PBBA라고 호칭할 수도 있지 않을까 싶습니다. 물론 제 개인적인 생각입니다.
플래시블레이드에 대해 보다 자세한 정보를 원하시면, 플래시블레이드가 어떻게 백업 환경을 향상시켜 주는지 설명해주는 라이트보드 영상을 시청해 보시기 바랍니다. 이 동영상에는 퓨어스토리지의 백업 파트너 Veeam도 소개되지만, Commvault, Veritas 등 퓨어스토리지의 많은 공식 백업 파트너들도 등장합니다. 또한 Oracle RMAN, Microsoft SQL Server, MySQL 등과 같은 네이티브 데이터베이스 백업 툴과 플래시블레이드를 함께 사용하는 방법을 설명하는 백서도 있습니다.
“지금으로부터 몇 년 후에는 플래시 어레이를 백업 타깃으로 사용하는 것이 보편화되고, 아마 몇 년이 더 지나면 어떻게 플래시가 아닌 다른 플랫폼을 썼을까 의아해하는 날이 올 것입니다.” 이것이 제가 2013년 작성했던 블로그에서 내린 결론이었습니다. 그리고 바로 지금, 그 날이 도래했습니다.