はじめに
ピュア・ストレージ・ジャパンは、お客様のデジタル変革を支援する取り組みの一環として、技術セミナー「The Orange Ring – Tech」を開催しています。
ストレージを選定するにあたって、製品比較は重要な判断要素となります。ピュア・ストレージのフラッシュ・ストレージは、他社製品と何が違うのでしょうか。2019 年 12 月 6 日に開催した The Orange Ring – Tech セミナー第 13 回では、株式会社NTTデータ ビジネスソリューション事業本部 デジタルビジネスソリューション事業部 開発統括部 第二開発担当 課長代理 福崎 一郎氏にご登壇いただき、ピュア・ストレージを選択するに至ったポイントをお話しいただきました。また、ピュア・ストレージ特有のアーキテクチャとアプローチについて、わたくし岩本が解説いたしました。本稿では、当日の内容を抜粋してご紹介させていただきます。
DaaS のインフラとして選ばれるピュア・ストレージ
NTTデータが提供するパブリック・クラウド・サービス「BizXaaS Office(BXO)」では、ファイル・サーバーやメール・サーバー、IaaS などのサービスのほか、DaaS(Desktop as a Service)もラインアップに含まれています。BizXaaS Office DaaS は、仮想 PC 型とサーバー共有型の両方が用意されており、Microsoft RDP や Citrix ICA、VMware Blast Extreme といった方式に幅広く対応しているのが特長です。
福崎氏は、2015 年に更新された BizXaaS Office DaaS のインフラ構築メンバーのお一人です。その際に、仮想 PC 用の iSCSI ストレージとしてピュア・ストレージを採用していただきました。以降、主にフルクローン(個人の Windows 10 環境を自由に利用できるタイプ)の仮想 PC での利用が多いとのことで、ピュア・ストレージの運用を継続されています。
「いきなりですが、ピュア・ストレージはスゴイです。データ削減機能の効果は絶大で、フルクローン仮想 PC を実容量の 1/8 から 1/12 でホストできています。これは標準的な実際の数字であり、お世辞ではありません。中には 1/20、1/30 にまで削減できているマシンもあります。ストレージのコストが 10 分の 1 になると考えれば、ハードディスクより安いかもしれません 。」(福崎氏談)
ただし、Windows の利用を続けると重複排除率が低下することを注意点としてご指摘いただきました。「単純なデータ量の増大」と「重複排除率の低下」という 2 つの軸で、容量監視を行わなければならないということです。具体的には、どのような状況だったのでしょうか。福崎氏によるお話をもとに、次のセクションで詳しくご説明します。
DaaS における重複排除機能の注意点
NTTデータにおいて、ピュア・ストレージ導入直後にあたる 2015 年、BizXaaS Office DaaS の新しいインフラの準備期間中に、ある現象が発生しました。
当初は、仮想 PC のクローンをどれだけ作ってもストレージの使用量はまったく増えず、データ削減率だけが上昇していきました。ユーザーが利用を開始すれば、データ削減率が低下しながらストレージ使用量が徐々に増えていくであろうとの予想のもとに、カットオーバーを行いました。ところが、サービスのローンチ後のある晩、突然ストレージ使用量が倍増するという現象が起きました。ユーザーが倍のデータを書き込んだということではなく、データ削減率が半減していたのです。きっかけはセキュリティ・パッチを含む Windows の月次パッチの適用でした。いつもより高い I/O が継続したのちに、重複排除率が低下しました。大量のパッチの適用によってデータ更新処理が重くなったことが原因でした。このときは仮想 PC の収容率が低かったため大事に至りませんでしたが、フル収容の状態であれば事故が発生していた可能性がありました。
こうしたトラブルを回避するため、重複排除に頼らず十分な SSD を搭載しておくという考え方もありますが、それではストレージ・コストが肥大化してしまいます。また、ピュア・ストレージには、重複排除を強制的に優先させる設定はなく、重複排除の処理性能にあわせてユーザー側で負荷を調整する必要があります。しかし、「一斉にディスク書き込みを行わない」ことをユーザーに期待するのは現実的ではありません。
そこで福崎氏らは、SAN スイッチで iSCSI の書き込み側のデータ流量のシェーピング(上限値の設定)を行いました。iSCSI の採用は別の理由からですが、ファイバー・チャネルよりも QoS 関連機能が充実しているために助けられたとのことです。
ただし、「重複排除が間にあうデータ流量」は、ユーザー側で計測する必要があり、さらに、格納されたデータの量や内容によって、値が大きく変わります。もし計測できたとしても、想像以上に小さな値が示されるかもしれません。実際にその値は NTTデータの環境では SATA HDD 以下であり、容易にシェーピングできるような値ではありませんでした。
「結局、重複排除が間にあわずに容量が肥大することをある程度受け入れて運用を継続しています。パッチ処理で容量が増えても、処理が完了したのちに重複排除が機能することを期待する運用です。危ういタイミングもありましたが、極端な制限はかけずに済み、1/8 から 1/12 のデータ削減率を保っています。」(福崎氏談)
ピュア・ストレージを VDI に採用する際のお薦めポイント
BizXaaS Office DaaS は大規模な商用サービスですが、分解すると比較的小さな仮想化環境が多数並んでいる環境です。同サービスで蓄積されたノウハウは、他の企業にも応用できるのではないでしょうか。そこで、ピュア・ストレージを VDI に採用する際に役立つポイントを福崎氏にご紹介いただきました。
ポイント 1:仮想マシンの収容数は徐々に増やす
重複排除を前提としたサイジングを行う場合、仮想マシンの収容数は徐々に増やすほうがよいでしょう。だれも利用していない仮想マシンは高い重複排除率を示しますが、収容率の高い状態で重複排除が効かなくなると、大きな問題に発展する可能性があるためです。
また、シェルフを追加できるような余裕のある構成で導入することも重要です。ラックスペースや電源も用意しておくと安心です。
ポイント 2:「Evergreen Gold」に加入する
Evergreen Gold に加入することにより、3 年ごとに新しいコントローラへの交換が可能になります。性能不足も交換によって解決できます。
「私たちも効果を体験していて、よいプログラムだと思います。」(福崎氏談)
また、フラッシュの高速性を活かすには、コントローラの CPU 性能にも注目すべきでしょう。
ポイント 3:重複排除の処理性能に注意する
導入当初は、重複排除の処理性能を気にすることなく運用できるかもしれません。しかし、セキュリティ系の処理に伴う負荷は、急に上昇する可能性があります。上述のセキュリティ・パッチのように、緊急性の高いものも発生するためです。EDR(Endpoint Detection and Response)の導入によって、情報収集のための処理が上昇するケースもあります。
NTTデータでの 4 年間の運用で実感したピュア・ストレージのよさ
福崎氏より、重複排除の効力を活かすための容量監視には注意が必要だという上述のご指摘とともに、以下の点において高い評価をいただきました。
- 重複排除がずば抜けている(ただし容量監視には注意が必要)
- 容量と帯域の監視以外にすることがなく、専門家不在でも運用が可能
- 活用するには高度な知識や経験が必要だが、 非常に高品質で物理故障もソフトウェアの不具合も少ない
- 無駄なアラートやログ出力がなく、管理画面がシンプル
- バージョンアップやコントローラ交換時においても問題は発生しておらず、サポート対応も高品質
「クラウド型管理ツールの Pure1 はたいへん便利です。管理サーバーの構築が不要で、全てのストレージを俯瞰することが可能です。不安な深夜処理をスマートフォンで眺めている管理者もいるかもしれませんね。」(福崎氏談)
独自のアプローチで高性能・大容量・堅牢性を実現
このセクション以降は、わたくし岩本がお話しさせていただいた内容となります。
ピュア・ストレージは、創業当初からオールフラッシュを前提としたストレージを開発・提供しており、フラッシュの扱いについても独自のアプローチを採用しています。
普通の SSD は、メーカーが開発したファームウェアで NAND を管理します。しかし、ピュア・ストレージは、自らファームウェアを開発し、OS である Purity 側で直接 NAND をコントロールしています。そのため、安価なフラッシュ・モジュールの採用が可能になります。
このアプローチによるメリットの 1 つとして、オーバー・プロビジョニング(OP:Over Provisioning)領域の扱いが挙げられます。一般的な SSD では、OP 領域を SSD メーカー側で確保しており、その結果、ユーザーが扱える容量は OP 領域を排除した分になります。一方、ピュア・ストレージは、Purity 側で 20% 程度の OP 領域を最適化しているため、ユーザーの使用可能容量を大きくできます。
もう 1 つのメリットは、SSD の寿命です。最新のピュア・ストレージ製品で採用している NVMe であれば、NAND のセルを直接扱うことができます。Purity 側でファームウェアを実装しているため、SSD にあわせて細かに書き込みを制御でき、寿命を最大化することが可能です。結果的にピュア・ストレージでは、安定しているが寿命に弱点があるといわれている「安価な MLC」を採用しています。また、SSD に最適な書き込みを行えるということは、ワークロードを選ばず高い性能を発揮できるということになります。
また、独自のファームウェアでフラッシュ・モジュールを統合管理できることは、データ削減率にも効果があります。アレイ単位で効率的なガベージ・コレクションを実施し、変更頻度の低いデータには強力なデータ圧縮を適用できます。その結果として、高評価をいただいている圧倒的なデータ削減率を実現しています。
ピュア・ストレージは、ハードウェアに依存せず、ソフトウェアで全てを制御することを目指しており、Evergreen Storage プログラムによってハードウェアを定期的に交換できるストレージを実現しています。また、上述のようにファームウェアを自社実装することによって節約した調達コストを Evergreen に還元し、保守コストの上昇を抑えています。
最後に、ピュア・ストレージ製品の圧倒的な差別化機能の 1 つとして ActiveCluster Pure1 をご紹介します。一般に、クラスタの構築や管理は面倒なものですが、ピュア・ストレージは非常にシンプルです。アレイが 2 台あれば、東京-大阪間でボリュームレベルのアクティブ/アクティブ環境を実現できますし、Pure1 で管理しているためインターコネクトの障害にも全自動で対応できます。もちろん無償の標準機能として提供しています。
Pure1 の機能は高度かつ広範で、ユーザーが扱いやすいようビジュアルにもこだわっています。文章ではなかなか表現しにくいため、ぜひデモを通じて体感していただきたいと思っております。お気軽にお問い合わせください。
おわりに
The Orange Ring – Tech の今後の開催スケジュールは、ただいま調整中です。決定しだい、本ブログ、ピュア・ストレージの Web サイトおよび Facebook でご案内いたします。
The Orange Ring – Tech ブログシリーズ
第 1 回 新しいストレージのカタチ-高速堅牢なオールフラッシュをクラウドライクに利用する
第 2 回 イマドキのストレージ設計-容量・性能はどう決める?
第 3 回 データ保護の最後の砦-バックアップの考え方
第 4 回 目標は簡素、実効は複雑なストレージマイグレーション
第 5 回 NVMe を最大限に活かすストレージ・ネットワーキングとは
第 6 回 AI/ビッグデータをビジネスに活かすには ─ 統合ストレージの重要性
第 7 回 ストレージ運用の問題はアーキテクチャから解決する
第 8 回 最先端のストレージ監視-迅速な障害対応や将来予測が可能に
Pure Storage、Pure Storage のロゴ、およびその他全ての Pure Storage のマーク、製品名、サービス名は、米国およびその他の国における Pure Storage, Inc. の商標または登録商標です。その他記載の会社名、製品名は、各社の商標または登録商標です。