ピュア・ストレージ・ジャパン FlashBlade セールスリードの大浦です。
本日ご紹介する記事は、FlashBlade プロダクトマーケティングのディレクター ロイ・キム (Roy Kim)による、「10 億ドル産業のバックアップ業界に欠陥あり ー ピュア・ストレージが解決します」です。お客様の抱えるバックアップの問題を FlashBlade がどのように解決できるかをこの記事でご案内させていただきます。
新たな技術による画期的な乗り物を考えてみました。既存の交通システムを置き換えるもので、ざっと見積もっても 10 億ドルの市場があると見込んでいます。その乗り物は、現在の列車やバスよりも遥かに大きく、一度に何千人もの人を A 地点から B 地点に運ぶことができます。あいにく帰りの便はありませんが、帰りたい人には自転車を貸与します。行きはよいよい帰りはなんとかですが、帰る予定がある人は、きっとこの乗り物は使わないでしょうね。
もちろんこれは架空の話です。私がこの記事で強調したいことをより際立たせるために持ち出しました。実際にそのようなソリューションは存在し、10 億ドルの市場規模があります。架空の話との違いは、その乗り物は人ではなくデータを移動するもので、IDC 社によって「専用バックアップ装置」(PBBA: Purpose-Built Backup Appliance)と名付けられています。
バックアップ業界に根付く2つの重大な欠陥
多くの組織にとって、データは極めて重要な資産です。特に SaaS のような業界では、データそのものが企業の生命線となります。したがって、データ保護は非常に重要な課題ですが、今日のアプローチには 2 つの重大な欠陥があります。
第一に、バックアップ業界が単一タスク実行のための柔軟性のないアプライアンスに支配されている点が挙げられます。ソースからターゲットには一方向でデータをコピーします。一方、コンピューティング業界では、このような柔軟性のない技術から、俊敏で柔軟なソリューションへの急速な移行が進んでいます。
第二に、さらに重大なのは、これらのアプライアンスにおけるデータリカバリのパフォーマンスが低いことです。ある独立系コンサル会社のブログ記事『If You Thought Database Restores Were Slow, Try Restoring From an EMC Data Domain』(英語)では、6 TB のデータベースの完全リストアに 25 日間かかると推定しています。彼らが実際に 24 時間かけたところ、ジョブの 2% しか完了しなかったことから導き出した数値です。
これら 2 つの欠陥は、インフラストラクチャの速度低下と過度な複雑さの要因であると私たちは考えています。詳しく説明しましょう。
これらのアプライアンスはバックアップ用に最適化されています。リストア速度が遅いため、ユーザーはストレージシステムを追加導入しなければなりません。さらに、運用パフォーマンスを迅速かつ予測可能な状態に保つには、実稼働データベースのスナップショット格納用にストレージを別途用意しなければなりません。このスナップショット格納用ストレージは、ティア1と同レベルのパフォーマンスをもつもので、すなわち、同レベルのコストもかかることになります。データベース管理者は、反復的な開発によるコード変更に対応するために、ライブコピーへのアクセスは可能な限り高速にしたいと考えています。バックアップ用アプライアンスからのデータのリストアは長時間を要するため、テスト・開発環境用に、さらに別のストレージシステムを導入することがよくあります。
また、リストア速度の遅さは、複雑さが増すこと以上の悪影響をもたらします。ディザスタリカバリ時など、迅速なデータ復旧が必要な場合には、このようなアプライアンスは事業継続のボトルネックになるおそれがあるのです。
高速でシンプル vs 低速で複雑
バックアップアプライアンスとストレージサイロは時代遅れの産物であると考えています。スタンドアロンの専用ハードウェアを使ったバックアップアプライアンスは、もはや効果的なソリューションではありません。強力な単一プラットフォーム上で動作するアプリケーションで置き換えることができます。
FlashBlade™ は次世代のプラットフォームです。非構造化データを扱うことを念頭に設計された業界初のスケールアウトストレージシステムであり、バックアップやリストアを含む広範なワークロードで前例のないパフォーマンスを提供します。FlashBlade を導入することで、高速リカバリ、テスト、開発、一般的なバックアップ操作などを単一プラットフォームに統合できます。
パフォーマンスについてもお話したいと思います。ピュア・ストレージのイベント「Pure//Accelerate 2017」で発表した、ブレード 75 基搭載の FlashBlade は、わずかラック半分のスペースで、バックアップパフォーマンスはピーク時で 90 TB/時、リストアパフォーマンスはその 3 倍の 270 TB/時を実現します。競合 Data Domain のハイエンド機種「DD9800」では、同製品のデータシートの情報によれば、同レベルのバックアップパフォーマンスを達成するのに 3 ラック分のスペースが必要です(※)。Data Domain のリストアパフォーマンスは公表されていませんが、バックアップパフォーマンスよりもかなり低いことが広く知られています。コストについては、このブログの後半で説明します。
※同製品のデータシートの情報より。DDBoost がオフの場合。
FlashBladeであらゆる複雑さを排除
実際には、今日一般的であるインフラストラクチャは上記のものよりも複雑です。多くのデータセンターは、専用のストレージサイロで実行される分析用のデータレイクとデータウェアハウスを備えています。開発チーム用に NAS やオブジェクトベースシステムを別途提供している場合もあります。
分析について詳しく見ていきましょう。データレイクとデータウェアハウスで構成された典型的なインフラストラクチャは複雑です。アプリケーションやユースケース毎に別のウェアハウスがあり、それぞれがデータレイクとの間でデータをコピーしています。この複雑な環境での運用は、利用者にとっても IT 部門にとっても悪夢です。
FlashBlade は、即時リストア、AI、ソフトウェア開発など、幅広いワークロードを処理できるように設計された業界初のデータプラットフォームです。あらゆる種類の非構造化データに対応します。非構造化データとはすなわち、任意の形式、サイズ、形状を持ち、任意のパターンでアクセスできる、予測不能なデータです。FlashBlade は、データの規模やアクセスパターンにかかわらず、あらゆるデータを高速化します。FlashBlade は、サンフランシスコで先頃開催された AI Summit 2017 において、革新的な AI 製品に贈られる「Best Innovation in AI Hardware」を受賞しました。
近代的なインフラストラクチャは、シンプルで高速、そして効率的でなければなりません。FlashArray と FlashBlade という2つのシステムが、その全てを実現します。
TB あたりのコストの意味とは
「バックアップアプライアンスにデータを格納する方が FlashBlade よりも低コストではありませんか?特に重複排除を使用した場合です。」という質問をよく受けます。
先ほどの Data Domain DD9800 と FlashBlade を比較した例でも、TB あたりの TCO において FlashBlade の優位性を実証できます。次のセクションで紹介する構成は、お客様における事例です。しかし、実際には、TB あたりのコスト比較はあまり意味がないと私たちは考えています。それはなぜでしょうか?
お客様の中には、データは保管するためにあると考えておられるケースがあります。こういったお客様は、データ分析を通じてビジネス価値を見出すためのスキルやツールの構築までには至っていません。この場合は、TB あたりのコストが絶対的な測定基準であると言えます。
一方、近代的なデータ主導の世界では、多くの企業が革新と競争の優位性を求め、積極的にデータを活用しています。データベース管理者は、最新のデータを使ってコードの反復更新をすることでアプリケーションを改善したいと考えています。データサイエンティストは、より多くのデータを分析する新しい方法を模索しています。このような企業ではデータに多くの価値があり、データを保管したままという状況はありえません。この場合の正しい測定基準は、洞察にかかる時間です。TB あたりのコスト比較は、ビジネスを真に反映するにはあまりにも静的です。そうなると、従来型バックアップアプライアンス(Data Domain など)のリストアパフォーマンスを知りたくなりますね。しかし、バックアップアプライアンスのベンダーはその数値を公表していません。なぜでしょうか。
米国政府機関での FlashArray/FlashBlade 導入事例 ― テスト・開発および分析の高速化
ピュア・ストレージのお客様である、米国のある州の運輸機関の事例を見てみましょう。ティア 1 の運用ワークロードは FlashArray で実行されていましたが、そのインフラストラクチャは多数のストレージサイロで構成されていました。また、データを 1.5 ラックの Data Domain にバックアップしていました。データベース管理者は Data Domain から直接データリカバリを行っており、それには多くの時間がかかっていました。また、非構造化データ用のさまざまなデータウェアハウスがありました。
やがて Data Domain システムのアップグレード時期が訪れ、フォークリフトアップグレードとデータ移行に膨大なコストがかかることが判明しました。そこで他の選択肢を検討した結果、FlashBlade によってバックアップインフラストラクチャを近代化かつ簡素化することに決めました。
現在、このインフラストラクチャは、テープアーカイブを除けば、FlashArray と FlashBlade のわずか 2 つのシステムだけで構成されています。サードパーティのソフトウェアが、FlashBlade との間、テープアーカイブとの間のすべてのバックアップ、リストアを制御します。1.5 ラックを要していた Data Domain、すべてのデータレイクおよびデータウェアハウスサイロを、FlashBlade は 1 台の 4U に統合しました。また、データへのアクセスが迅速になり、データセンターの管理がシンプルになったことで、データベース管理者は新たな分析プロジェクトを開始する余裕ができました。
さらに特筆すべきは、大幅なコスト削減です。お客様から次のようなコメントをいただきました。「設置スペースと消費電力の削減により、FlashBlade のコストを 1 年で回収できました。」
バックアップインフラストラクチャの近代化
近代化を始めるのは簡単です。主要なデータ保護ソフトウェアは FlashBlade をサポートしています。Commvault と Veeam は、FlashArray からFlashBlade にバックアップできます。FlashBlade から任意のアーカイブ層にもバックアップできます。Veeam 社のブログ(英語)では、Veeam と FlashBlade の活用によって ROI を向上させる方法を紹介しています。また、Rubrik と共に使用する場合は、FlashBlade は即時リストアを提供する大容量ストレージ階層となります。Rubrik 社のブログ(英語)では、同社の Cloud Data Management プラットフォームによる迅速なリストアについて詳しく紹介しています。
Oracle RMAN などのネイティブアプリのユーティリティを使用する場合、FlashBlade はバックアップおよびリストアにおいて極めて優れたパフォーマンスを提供します。ブログ記事『FlashBlade における Oracle RMAN の高速化』では、Oracle RMAN を使用して 15 TB/時のバックアップと 11 TB/時のリストアを実現する方法を紹介しています。MySQL と SQL Server についてのブログも近日公開します。
データ保護の近代化を目指すのに遅すぎるということはありません。ピュア・ストレージがお手伝いします。ピュア・ストレージの高速でシンプルなデータプラットフォームで、インフラストラクチャの複雑さの解消とコスト削減を実現してください。詳細はこちらをご覧ください。
大浦からのコメント
FlashBlade をバックアップと高速リストア環境で使用するケースが増えてきています。特に、肥大化するデータベース環境をお持ちのお客様や、多数のインスタンスを運用しながら高い頻度でリストア要求のある SaaS 企業のお客様には、「リストアの高速化」が大きなビジネス価値をもたらします。また、バックアップ環境の統合に超高集約・高効率の FlashBlade を用いることより、電力消費や設置スペースの削減が可能になるため、コスト削減にもつながります。
既存のバックアップ環境の拡大やデータの肥大化により、リストア時間に不安をお持ちの方がいらっしゃいましたら、ぜひご相談ください。検証テストなども含め、改善のご提案をさせていただきます。
英語版:The Billion-Dollar Backup Industry is Flawed. Here’s How We’re Fixing It.