イマドキのストレージ設計 ― 容量・性能はどう決める?

The Orange Ring – Tech セミナー第 2 回『ストレージの設計・サイジング ~容量・性能編~』を抜粋してご紹介します。


はじめに

ピュア・ストレージ・ジャパンは、お客様のデジタル変革を支援する取り組みの一環として、技術セミナー「The Orange Ring – Tech」を開催しています。本稿では、2019年8月29日開催の第 2 回『ストレージの設計・サイジング ~容量・性能編~』から、急激に進化する IT 環境に適したストレージ設計の手法と重視すべきポイントについて、わたくし福島と、プリンシパルシステムズエンジニアの岩本知博が行った解説の内容を抜粋してご紹介します。

※2019年8月2日開催の第 1 回の内容については、先日公開したブログでご紹介しています。

技術の進歩でストレージ設計も変わる

ストレージは製品ごとに機能や性能が異なり、サーバーやネットワークと比較して、導入や運用において IT  担当者が悩みがちな領域です。ストレージの導入フローにおいて、特に重要なのがサイジングです。この段階で失敗してしまうと、その後の設計や構築、運用が困難になってしまいます。

従来、「ストレージ設計」と言えば、要件ヒアリング・定義→サイジング(容量・性能)→物理設計→論理設計→機能設計→運用設計という段階を経るものでした。

図 1 – 今どきのストレージ設計とサイジング

近年のストレージ設計は、旧来の手法とは、重視するポイントが異なります。サーバーやネットワーク、ストレージは、いずれも新しい技術が登場し、機能が増え、急速に進化しています。高性能・多機能になるということは、設計に関わる要素が増えるということです。ほんと
うに旧来のままでよいのでしょうか。今どきの設計を考える必要があるのです。

図 2 – 今どきのストレージ設計とは

一般的にストレージ設計では、「容量」(RAID、ボリューム、機能)と、「性能」(IOPS、応答時間、スループット)を主に検討します。そして、容量や性能に関わる機能として、シンプロビジョニング機能、重複排除や圧縮といったデータ削減機能、スナップショットのような
バックアップ機能などの要不要について確認します。

図 3 – ストレージ設計の基本

容量設計は最初が要、データ削減率に注目

まず、容量の設計についてご説明します。

RAID は、複数のディスクを1台の仮想的なディスクとして利用する技術で、冗長性・信頼性を向上したり、性能・可用性を向上したりする仕組みとして古くから利用されています。

図 4 – RAID 設計

RAID には、RAID 0/1/01/5/6 といった種類があり、書き込み条件や容量などの要件によって 1 台のストレージの中でも使い分けるのが普通でした。

RAID メリット デメリット
0 (stripe)
  • I/O を複数 HDD に分散してデータを記録するため、高速
  • 冗長性、耐障害性はなし
1 (mirror)
  • I/O を 2 台同時に同じデータを記録するため、冗長性の向上
  • 倍の記録容量が必要となるため、実効容量は半減
10 (1+0,0+1)
  • RAID0、RAID1 の組み合わせ
  • 性能と信頼性の両立
  • 倍の記録容量が必要となるため、実効容量は半減
5 (single parity)
  • データの記録時に Parity データをRAID 構成した HDD に分散して配置
  • 性能と信頼性の両立
  • パリティ計算のオーバーヘッドで書き込み性能が低い
6 (double parity)
  • データの記録時に二重化した Parity データを HDD に分散して配置
  • RAID5 より信頼性を向上
  • パリティ計算のオーバーヘッドで書き込み性能が低い

 

図 5 – 古い RAID 構成の例

また信頼性向上のために、ホットスペアを用意するのも一般的でした。最近はオールフラッシュストレージが多用されるようになりました。

この領域の製品は、ベンダー独自の最適化された RAID 構成を採用していることが多く、RAID 設計を考慮する必要がなくなっています。また独自の復旧機能を活用することにより、ホットスペアがなくとも十分な信頼性を得られるよう工夫されています。ただし、運用後に RAID を切り替えることはできないため、一番最初に行うサイジングが肝になります。

図 6 – 今どきの RAID 設計

ボリューム設計の切り出し手法は従来と大きく変化しません。後述するスナップショット領域やその他の機能を利用したときのメタデータやオーバーヘッドで占有される領域を考慮して、ボリュームの実効容量を算出します。

図 7 – ボリューム設計

スナップショット領域においては、ローカルバックアップの用途として、複数世代保有することを考慮します。また長期間保存する必要がある場合、ボリュームの肥大化に注意が必要です。

図 8 – スナップショット領域

シンプロビジョニング機能やデータ削減機能は、サイジングに大きく影響するため、慎重な検討が必要です。

図 9 – 機能設計

シンプロビジョニングは、物理容量以上のボリューム容量をサーバーに割り当てることのできる仮想化技術です。利用者の要件に合わせて割り当てさえすれば、実容量の増減だけを気を付ければ良いため、運用が容易です。

図 10 – シンプロビジョニング

また、データ削減機能である重複排除機能や圧縮機能を用いることで、保存するデータ容量を削減することができます。これらの機能には、ポストプロセス方式とインラインプロセス方式という2種類があります。

従来の主流であったポストプロセス方式は、一旦データをストレージに保管した上で、あとから重複排除・圧縮をかける手法です。一旦全てのデータを格納するための容量が必要です。今どきは、データを保管する前に重複排除・圧縮をかけるインラインプロセス方式が主流です。ストレージにかかる負荷は大きくなりますが、全データを一時格納するための容量が不要です。またフラッシュストレージにおいては、書き込み回数を減らすインラインプロセス方式の方が長寿命化の点で有用です。

図 11 – データ削減

ピュア・ストレージのストレージ製品は、重複排除と圧縮の双方を実装し、非常に高いデータ削減率を誇ります。アプリケーションによって異なりますが、データベースなら 2~3 倍、サーバー仮想化なら 5~9 倍、VDI であれば 10 倍以上のデータ削減率を実現します。また、ピュア・ストレージではサイジング時よりもデータ削減率が低下した場合、無償で容量を追加する為の「容量保障プログラム」も提供しております。

図 12 – ピュア・ストレージのデータ削減

高価なオールフラッシュストレージを選定するにあたって、データ削減率は非常に重要な要素です。容量単価の低減、ひいては TCO の削減に繋がります。重複排除と圧縮の両方を実装している製品を選定することが重要です。

図 13 – データ削減のメリット

オールフラッシュは容量と性能のバランスが取れる

ストレージ設計におけるもう一方の重要ポイントが「性能」です。設計段階では、性能指標として、「IOPS(1 秒あたりの Input/Output 処理数)」を利用し、ディスクメーカーが公表している IOPS値を目安に RAID を構成します。

図 14 – 性能の設計

要件を満たす性能を構成する上で、3 つの課題を検討する必要があります。

  1. 容量と性能のバランス
  2. コントローラ
  3. 性能の変動

まず、容量と性能のバランスについて説明します。ハードディスクドライブは、1本あたりの容量が増加傾向にあります。しかし、性能を確保するためにはドライブ本数を増やす必要があり、仮に 10 万 IOPS を SAS ドライブ(200~300 IOPS)で実現しようとすれば、400 本(ラック 2 基分)程のドライブが必要になります。大抵の場合、性能に対して容量が過剰になってしまいます。

図 15 – 課題 1:容量と性能のバランス

また、アプリケーション/ワークロードによっても必要な性能が異なります。要件ごとにストレージを分けるか、すべての性能要件を満たすストレージに集約するか、いずれかを選択することになります。

図 16 – ワークロードによる性能の差

今どきの構成として考えるのであれば、オールフラッシュストレージ製品を選択することで、容量要件と性能要件を同時に満たすことが可能です。

図 17 – 今どきの構成

2 つ目の課題は、コントローラです。性能を追求するのであれば、冗長化されたコントローラをアクティブ-アクティブで用いると効果的です。しかし、コントローラの片系をメンテナンスしているときや故障が発生したときには性能が半減してしまうという問題があり、サイジングの際に注意したい要素となります。

図 18 – 課題 2 – コントローラ

そして、「高速」といわれるフラッシュであっても、扱うデータのブロックサイズや読み書きの比率によって性能が大幅に変わってしまうというのが 3 つ目の課題です。カタログには非常に良好なスペックが記されていても、標準的なアプリケーションが扱うものよりも、小さなブロックサイズのものを示している可能性があります。どのような状態のデータか、しっかりと確認されることをお薦めします。

図 19 – 課題 3 – 性能の変動

ピュア・ストレージのフラッシュアレイは、多様なワークロード、さまざまなブロックサイズや読み書き比率のいずれでも、高い IOPS を示すためのアーキテクチャを採用しています。そして、コントローラの片系が停止しても、性能を維持し続けるように設計されています。

図 20 – ワークロードを選ばないアーキテクチャ

HDD と同じ悩みは NVMe で解決できる

SSD の進化にも課題があります。

「SSD も 1 本あたりの容量が急速に大きくなりました。そして、小さな SSD が調達できなくなっていきます。その結果、特に書き込み性能を向上しようとすると容量が大きくなりすぎるという、HDD と同様の問題が発生してしまうのです。」(岩本談)

図 21 – SSD の進化にも課題がある

ここで救世主となるのが「 NVMe 」技術です。HDD 向けの規格である SATA/SAS と比べて、SSD 専用規格のため非常に高速です。ピュア・ストレージでも、従来の Mシリーズ/SAS SSD のハイエンドモデルで最大性能を発揮しようとすると68基のドライブが必要でした。NVMe SSD を採用した Xシリーズであれば、ハイエンドモデルであっても 10 基で最大性能を実現することが可能です。

図 22 – 最大性能を 1/6 の構成で – NVMe 技術

またピュア・ストレージであれば、インラインプロセス方式の重複排除・圧縮を利用しても、性能が低下することはありません。また、運用を続けて不足を感じるようになっても、上位機種のコントローラへアップグレードすれば性能を向上することが可能です。

ピュア・ストレージを利用した今どきのストレージ設計であれば、物理設計や機能設計に悩む必要はありません。最も重要な容量・性能のサイジングに注力し、最適化を図ることが主流になっていくことでしょう。

図 23 – 今どきのストレージ設計・サイジング

The Orange Ring – Tech の開催スケジュールと参加お申し込みについては、こちらをご覧ください。


Pure Storage、Pure Storage のロゴ、およびその他全ての Pure Storage のマーク、製品名、サービス名は、米国およびその他の国における Pure Storage, Inc. の商標または登録商標です。その他記載の会社名、製品名は、各社の商標または登録商標です。

CloudNative Days Tokyo 2021
ニュース・イベント

クラウドネイティブな皆さまへ:コンテナ・ステートフルなセルフサービス・データ・プラットフォーム「Portworx」をご紹介します

【10.15.2021 JST】本ブログでご紹介してまいりました「Kubernates のための包括的なストレージ・プラットフォーム」について、国内最大級のテック・カンファレンス「CloudNative Days Tokyo 2021」にて講演させていただくことになりました。

By 溝口 修