フラッシュ→フラッシュ→クラウドへ ― テープバックアップの終焉

みなさん、こんにちは!FlashBlade SE 部長の城野です。今回は、ピュア・ストレージのバックアップ・データ保護戦略について取り上げた、「フラッシュ→フラッシュ→クラウドへ ― テープバックアップの終焉」をご紹介します。FlashBlade 戦略&オペレーション部門副社長 エイミー・ファウラー(Amy Fowler)による英語記事をベースとしています。

テープバックアップ衰退の理由

「バックアップにフラッシュ?」と意外に思われるかもしれません。高性能データハブである FlashBlade™ がバックアップのために利用されていると知ったときは、私たちも驚きました。バックアップは、一般的に戦略性が低いものとして認識されているがゆえに IT 予算の割り当ても少なく、お客様の多くが FlashBlade で運用する他の分析系ワークロード(データウェアハウス、データレイク、ストリーミング分析、AI クラスタなど)とは釣り合わないように思えたからです。

そのお客様に詳しいお話を伺ってみると、さらに興味深いことが見えてきました。これからのバックアップでは、フラッシュとクラウドが主要な役割を担っていくであろうことを確信したのです。

バックアップの目的は、「データを低コストで複製すること」から「データを利用可能にすること」へと変化しています。「復元」から「創造」への変革です。

フラッシュでバックアップ?

そもそも、フラッシュをバックアップのために使い始めた理由は何だったのでしょうか。フラッシュのような高性能が本当に必要だったのか、コスト的な問題はなかったのか、といった疑問が湧いてきます。しかし、その疑問はすぐに晴れました。フラッシュを選んだのは、バックアップよりリカバリを重視した結果でした。DR やテスト・開発、クラウド上でのデータ再利用のためにフラッシュが必要だったのです。

データ保護に対する考え方は、この 10 年で大きく変わりました。近年、データセットはテラバイトからペタバイトへ、それ以上へと、まるでカンブリア爆発のような勢いでデータの増大が続いています。また、フラッシュの登場により、データセンターに新次元の性能がもたらされました。データの重要性はますます高まり、多くの近代的ビジネスの基盤となっています。こういった背景から、以前は最も重要なワークロードに限定されていた高度な RTO(目標復旧時間)の設定が促進され、本番ワークロードの新標準となりつつあります。

ところが、バックアップや、さらに重要なリカバリの性能が追いついていませんでした。ちなみにこれは特別なことではありません。今日のバックアップの成功率は 75〜85% [*1] で、バックアップに成功した場合でもリカバリの 20%が RTO を満たしていません。従来の「ディスク→ディスク→テープ(D2D2T)」によるバックアップアーキテクチャでは、常に大量に発生する複雑なデータを保護することは困難になっています。また、これらの古いモデルを単純にスケーリングするだけでは、根本的な問題解決には至りません。

過去のものとなった D2D2T

D2D2T は、現時点では多くのお客様に使用されているバックアップアーキテクチャで、これにはディスクとテープの両方が関わっています。D2D2Tでは、データをまずディスクベースのバックアップアプライアンス上に複製してからテープに保存します。ディスクは、テープよりもリストア性能が高い反面、テープより高価だという問題があります。そのため、バックアップアプライアンスでは、重複排除を行うことによってディスクベースのバックアップソリューションの費用対効果を高めています。重複排除が行われても、ディスクは依然としてテープに比べて高価ですが、管理効率が改善されることでコストの差をなんとか相殺しています。このような D2D2T 方式は、データのリカバリはバックアップアプライアンスから、データの長期保存はテープで行うことを可能にしました。

D2D2T は、テープにおける管理上の課題をある程度解決したことになります。例えば、リストアの際にテープを探しに行ったり、データが全部揃っているか心配したりする必要がなくなりました。また、バックアップアプライアンスは、バックアップの保存にディスクを使用することでリストアに要する時間を短縮しており、テラバイト級のデータセットを数時間でリストアすることができます。

D2D2T によってバックアップは従来の方法と比較して大幅に近代化されましたが、その一方で、拡張性に乏しいバックアップアプライアンスの管理が新たな課題となっています。データ容量を使い切ってしまうとアプライアンスを追加購入する必要があり、保存するデータ量が増え続ける限り、それを何度も繰り返さなければなりません。また、追加購入するアプライアンスはそれぞれ新たな重複排除機能や管理ゾーンをもたらし、このことが非効率性の原因となります。

最も大きな問題は、ディスクはテープよりも高速ではあるものの、ほとんどのバックアップアプライアンスにおいてリストアが低速であることです。バックアップアプライアンスはバックアップデータをできる限り高速に取り込むように設計されていますが、リストアの性能は重要視されていないのです。迅速なリストアを可能にするには、プライマリストレージがデータを処理するのと同等の速さでデータを供給しなければなりません。ところが、バックアップアプライアンスでは、ディスクが一杯になるにつれてリストア速度が低下するため、システムの効率的な運用が難しくなります。

余談ですが、映画『ガーディアンズ・オブ・ギャラクシー』(原題:Guardians of the Galaxy)の中でカセットテープが象徴的なアイテムとして登場したことがきっかけで、2017 年の米国の音楽カセットテープの売上が前年対比 35%アップしたそうです[*2]。とは言え、テープからのリストアを、IT管理者がまったりとコーヒーを飲みながら待つのがかっこいいということにはならないでしょう。

バックアップとリカバリはフラッシュが主流に

ディスクと比較して、フラッシュは桁違いの性能を提供します。フラッシュは、本稼働システムがデータを処理するのと同等の速さでリストアを実行する、すなわちデータを供給することができます。さらに、フラッシュによるバックアップは、より多くのサーバーの同時バックアップを可能にすることで大規模な環境にも対応できるようになっています。フラッシュは、データ削減との相乗効果によって優れたコスト効率とリストア性能を実現し、「フラッシュ→フラッシュ」がバックアップウィンドウやリストア SLA の課題の解決策となります。

ピュア・ストレージの FlashBlade™ は、広大な帯域幅を備えた次世代のフラッシュプラットフォームです。バックアップや高速リストアを含むさまざまなワークロードにおいて、かつてない性能を発揮します。競合他社の製品とは異なり、FlashBlade は、バックアップ性能を上回るリストア性能を提供します。ブレード 75 基搭載の FlashBlade は、わずか 22U で、ピーク時のバックアップ性能は 90 TB/時、リストア性能は最大でその 3 倍の 270 TB/時(75 GB/秒)を実現します。

FlashArray™ のスナップショットは、FlashBlade に直接バックアップすることが可能で、FlashBlade で永続化されて高速リカバリに備えることができます。また、スナップショットメタデータがスナップショットにカプセル化される「ポータブルスナップショット」と呼ばれる新しいスナップショットタイプにより、環境を選ばずリストアができるようになっています。

FlashBlade で高速リストア

FlashBlade がデータバックアップおよびデータ保護に使用されているという事実に触れたことを機に、私たちは高速リストアソリューションを開発しました。このソリューションは、全ての主要データベースと、新旧データ保護ベンダーが提供するさまざまなデータ保護ソリューションをサポートしています。高速リストアソリューションは、10 以上の異なるバックアップおよびリカバリのユースケースの集合であり、含まれるユースケースは増え続けています。

特に、データベースのための高速リストアソリューションは極めて高速です。 1台の FlashBlade で、バックアップ性能は 15 TB/時、リストア性能はおよそ 50 TB/時を達成します。FlashBlade への Oracle RMAN バックアップでは、およそ 3:1 のデータ削減が可能なため、非常に短時間でデータベースのリストアを完了できます。

また、従来のデータ保護ソフトウェアのターゲットとして FlashBlade を使用することで、フットプリントを低減しつつ性能の向上を実現することも可能です。FlashBlade にビルトインされている圧縮機能と、重複排除、レプリケーション、クラウド階層化などのデータ保護パートナーの機能を合わせて使用することで、バックアップインフラストラクチャの性能、容量、耐障害性を最適化できます。

フラッシュ→フラッシュ→クラウドによる近代的なソリューション

バックアップに関してはもう一つ問題があります。FlashBlade を効果的に使用することで高速リストアを実現できたとしても、保管やコンプライアンスを目的として大量のデータをオフサイトに保存することが必要な場合があります。テープが未だに利用されている理由がそれです。前述のとおり、テープには管理の複雑さと低速さという短所がありますが、真の弱点は、データがオフラインで保管されているだけで、そこから何の価値も得られないことです。

F2F2C ― データ保護の理想型

いずれ、Amazon S3 のような、低コストのクラウドオブジェクトストレージがテープに取って代わることになるでしょう。「フラッシュ→フラッシュ→クラウド(F2F2C)」は、新しいバックアップパラダイムです。ピュア・ストレージは、この新しいバックアップパラダイムへの移行をサポートするソリューションを提供しています。FlashArray にビルトインされている CloudSnap は、その一例です。CloudSnap は、他の FlashArray やFlashBlade、NFS デバイス、または直接クラウドに、ポータブルスナップショット機能を提供します。スナップショットは重要ですが、バックアップとデータ保護ももちろん重要です。次のセクションでご説明します。

ObjectEngine™ — 業界初の F2F2C データ保護プラットフォーム

Pure Storage ObjectEngine プラットフォームは、近代的なビジネスを確実に保護するために、フラッシュとクラウドをベースに開発された、業界初の F2F2C データ保護ソリューションです。 ObjectEngine によって、迅速なリカバリ、クラウドの経済性を活かしたコスト削減、および、GDPR・プライバシー保護、分析、AI などの Web サービスでのデータの再利用が可能となります。

フラッシュとクラウドが生み出すシナジー

ObjectEngine プラットフォームは、ObjectEngine//A と ObjectEngine Cloud という 2 種類の構成で提供されます。ObjectEngine//A はオンプレミスのシステムで、アプリケーションとバックエンドオブジェクトストアの間にシームレスに配置されます。透過的にインラインデータ重複排除と暗号化を実行し、ストレージとデータ転送のコストを最大 97%削減します。オールフラッシュオブジェクトストレージからの高速リストアを既に可能にしているスケールアウトストレージシステムの FlashBlade と組み合わせることで、RTO のさらなる短縮と災害時における高速リカバリが可能になります。ObjectEngine//A は全世界に向けた提供を開始しており、現在日本国内での販売体制を整えているところです。

ObjectEngine//A のベースクラスタは、クラウドネイティブのスケールアウトアーキテクチャに基づいて構築されており、最大バックアップ性能 25 TB/時、最大リストア性能 15 TB/時を実現します。ObjectEngine は、オンプレミスのオブジェクトストレージやクラウド、ハイブリッドクラウドにまたがる単一の名前空間で数百ペタバイトのデータを管理できます。データサイロを排除し、管理の手間を低減し、イノベーションの創出を支援します。

ObjectEngine Cloud は、クラウドでスケールアウト機能を提供するクラウドネイティブのソフトウェアです。ObjectEngine Cloud を使用することで、データを Web サービスで再利用することができます。ObjectEngine Cloud の一般提供は 2019 年後半を予定しています。

眠っているデータを有効活用

バックアップデータをクラウドに取り込むことができれば、データの移動をはじめ、開発・テスト、分析などのためのデータの利用が容易になります。ObjectEngine Cloud はクラウド内で動作するように設計されており、クラウド用のバックアップソフトウェアを利用してクラウド内で完全にリカバリを行うことができます。将来的には、ピュア・ストレージの Cloud Block Store、または Amazon データサービスへのリストアも可能になります。倉庫で眠るテープ上のコールドデータを、いろいろな Web サービスを利用してビジネス価値に変えることができるのです。

おわりに

ObjectEngine は、オンプレミス用のアプライアンス「ObjectEngine//A」と、クラウド上のソフトウェア「ObjectEngine Cloud」の2通りで展開し、あらゆるお客様に対して最適な F2F2C バックアップ戦略を支援することを可能にします。ピュア・ストレージの F2F2C バックアップ戦略については、Forbes 社の記事にも取り上げられています。英語の記事ですが、ご参考にしていただければ幸いです。

*1 出典:Disaster Recovery Journal、https://www.drj.com/articles/online-exclusive/backup-is-broken-and-heres-the-fix.html (アクセス日 2019年4月11日)

*2 出典:The River、https://theriver.jp/gotg-cassette/ (アクセス日 2019年4月14日)