はじめに

ピュア・ストレージ・ジャパンは、お客様のデジタル変革を支援する取り組みの一環として、技術セミナー「The Orange Ring – Tech」を開催しています。2019 年 10 月 4 日に開催された第 5 回『ストレージ・ネットワーキングとは?』では、フラッシュ・ストレージ領域で注目度の高い NVMe に着目し、NVMe の能力を最大限に生かすためのストレージ・ネットワーキングとはどのようなものかについて、基礎から最先端の技術まで解説させていただきました。

本稿では、ゲスト・スピーカーとしてお招きしたメラノックス テクノロジーズジャパンの大村 鉄夫氏、ブロードコム・ジャパンの菱田 明彦氏と、わたくし高城が行った講演の内容を抜粋してご紹介させていただきます。

内部コンポーネントの 1 つだったストレージを外部へ

元来、ストレージはコンピュータのコンポーネントの 1 つであり、主記憶装置であるメモリに対して補助記憶装置として機能するものでした。コンピュータの活用が進むにつれてデータ量が増大し、容量を増やしたい、アプリケーションの要求に応じて技術を選択したい、性能や信頼性を向上させる機能を追加したいというニーズが高まったことで、ストレージはコンピュータの外へ出るようになりました。

しかし、SCSI などの技術を活用して外に出たストレージにも、新たな課題が生まれました。速度や接続距離、接続デバイス数やポート数にも制限がありました。利用効率の低下も問題です。サーバー仮想化技術が広まると、複数のサーバーとストレージのアクセス制御やサーバーの移行など、複雑な問題も発生するようになりました。このような課題を解決するのが、「ストレージ・エリア・ネットワーク(SAN)」技術です。

ネットワークを介したストレージ・アクセスには、大きく分けて 3 つの形態があり、それぞれに特徴があります。

  • ブロック単位でのアクセス
  • ファイル単位でのアクセス
  • オブジェクトに対して、プログラムや API などから HTTP ベースのプロトコルなどを経由するアクセス

このうち、SAN に該当するものは “ブロック単位でのアクセス” です。“ファイル単位でのアクセス” と “オブジェクトへのアクセス” は、ネットワーク・ストレージ・デバイスに分類されます。

トランザクション単位 ブロック単位でのアクセス ファイル単位でのアクセス オブジェクトへのアクセス
プロトコル ファイバー・チャネル(SCSI)
iSCSI
FCoE
NVMe/F
CIFS
NFS
Amazon S3 互換、EST(HTTP)など
物理インタフェース ファイバー・チャネル
イーサネット
コンバージド・イーサネット
TCP/IP(主にイーサネット) TCP/IP(主にイーサネット)
適合データ トランザクション・データ
(データベース)
共有ファイル・データ クラウド・データ
更新頻度:大 更新頻度:中 更新頻度:小
容量要求:中 容量要求:中~大 容量要求:大

(参考:ブロードコム社スライド「ストレージ・アクセスごとの特徴」)

SAN の代表格である ファイバー・チャネル は NVMe にも対応

ファイバー・チャネル(FC)は、SAN を構築するためのオープン規格です。IP に代表されるネットワーク技術とメインフレームで利用されるチャネル技術を融合し、それぞれの利点を兼ね備えた技術として登場しました。上位レベルのプロトコルは柔軟で、SCSI や IP、FICON などのほか、最近では NVMe にも対応しています。

ファイバーチャネルの成り立ち

FC-SAN は、サーバー・プールとストレージ・プールを「SAN(FC)スイッチ」で接続する構成を採ります。サーバーには LAN 環境の NIC に該当する「ホストバス・アダプタ」を搭載し、専用の光ファイバー・ケーブルでつなぎます。ストレージは FC に対応したブロック・ストレージを選びます。

FC-SAN の構成要素

FC-SAN の利点の 1 つは、コンピュータとストレージの距離を広げられるところにあります。旧来の SCSI は、10 メートル以下という制限がありましたが、FC によって直結でも 10 キロメートルまで延長され、FC スイッチによってストレージ・エリア・ネットワーク(SAN)が実現できるようになりました。

FC-SAN は、ストレージ/サーバー間の通信に特化したネットワークで、フレームのドロップなどのロスがないという利点があります。そのため、ミッション・クリティカルな用途に向いています。他方の IP ストレージ・ネットワークは、安価で手軽に構築できますが、パケット・ドロップなどのロスを前提とした技術です。

LAN と SAN の “N”(ネットワーク)の役割には違いがあり、似て非なるものです。

  • LAN のネットワーク:
    コミュニケーションのため、さまざまなデバイスがさまざまなアプリケーションで多種多様に通信するためのネットワーク
  • SAN のネットワーク:
    経路を共同利用するためのもので、複数の補助記憶装置を束ねたもの

従来の環境ではサーバーごとにストレージをつなぐ非効率な運用が行われてきましたが、SAN によって、効率よく運用できるストレージ統合環境を実現できます。また、データ統合によって異なるサービスや業務からの情報共有も容易になるというメリットも享受できます。

InfiniBand の技術を応用した高速・高信頼な Ethernet

メラノックス テクノロジーズは、イスラエルに本拠を持ち、インフィニバンド(InfiniBand)やイーサネット(Ethernet)に対応したネットワーク製品を開発・提供するメーカーです。ストレージ領域では、同社の独自技術を用いた「Ethernet ストレージ・ファブリック」に注目しています。

Ethernet を含むネットワーク技術は伝送ロスが発生することを許容しており、そのためにミッション・クリティカルな用途には向かないと考えられていました。しかし、メラノックスでは InfiniBand 向けに開発されている半導体を活用し、ロスレスの Ethernet を実現しています。一方で、InfiniBand にはなく Ethernet に必要なバッファ・メモリの管理機能も搭載しています。

ストレージやデータのボトルネックは遅延

メラノックスの Ethernet スイッチは、FC と同等のメリットを実現しながら、FC 以上のスピードを実現しています。25 Gbps 以上の高速なネットワークを必要とする企業では、非常に高いシェアを誇っています。

現在のストレージ領域では SSD が主流となりつつあり、従来の SSD NAND と比較して遅延が非常に小さく高速な「NVMe」が次世代技術として注目されています。その能力に対してネットワークがボトルネックとなりがちですが、メラノックスのスイッチやアダプタは、こうした次世代技術を最大化するソリューションを目指しています。

注目すべきもう 1 つの技術が「RDMA(Remote Direct Memory Access、リモート DMA)」です。RDMA は、HPC / InfiniBand の領域では標準的に用いられるコマンドで、Ethernet 上で PCI Express(PCIe)と同等レートのデータ転送を実現できる技術です。メラノックスの NVMe over Fabrics(NVMe-oF)であれば、RDMA 技術をそのまま利用でき、NVMe の高速・低遅延性を生かすストレージ・ネットワークを構築できるというわけです。

RDMA でオーバーヘッドを削減

最新の NVMe Gen.4 M2 スティックは、1 枚でも 40 Gbps、並列構成で 120 Gbps を発揮します。つまり、ストレージのコア・ネットワークには 100 GbE の性能が必要となります。高速ストレージ向けのネットワーク製品は、遅延が小さくパケット・ロスがないこと、バースト・トラフィックに強いこと、ノードごとに公平な通信が可能であることが重要です。そして、高性能でリーズナブルなストレージが登場していることから、ネットワークもリーズナブルで収納効率がよいものを選びたいところです。

ブロードコムのファイバー・チャネルで NVMe を活かす

NVMe は、フラッシュ・ストレージのポテンシャルを引き出すために生まれた規格です。非常に高い IOPS/スループットと低遅延性が特徴で、CPU 使用率も小さいというメリットもあります。SAN 環境で NVMe の性能を生かすには、NVMe に適したネットワーク・ストレージ・ファブリックを選択する必要があります。

ストレージ・ファブリックにはいくつかのタイプがあり、FC 、Ethernet(RoCE、iWARP)、InfiniBand などが挙げられます。この中で FC は、最も低遅延でロスがなく、最大 128 Gb という広帯域を持ち、拡張性に優れ、エンタープライズでの実績も豊富です。

ファブリック・タイプ 遅延 ロスレス/確定性 帯域幅 拡張性 エンタープライズでの実績
ファイバー・チャネル かなり
低い
保証 32 Gb / 128 Gb あり 主要なストレージ・ファブリック
Ethernet(DCB)
(RoCE v2)
低い 低い 25 Gb / 100 Gb あり なし
InfiniBand / Omni-Path 非常に
低い
保証 56 Gb / 100 Gb 限定的 学術関連に限定
(Omni-Path の実績なし)
Ethernet(iWARP) 中程度 なし 25 Gb / 100 Gb あり なし

(参考:ブロードコム社スライド「NVMe over Fabrics – 選択肢」)

FC が NVMe ストレージに適している理由は 3 つあるとブロードコムは考えています。

  • 性能
  • 拡張性と信頼性
  • 投資とコスト

それぞれについて以下に説明します。

性能

ブロードコムの調査によれば、NVMe over Fibre Channel(NVMe over FC)と SCSI over Fibre Channel(SCSI over FC)を比較すると、同じハードウェアでも劇的な性能差が生じるとのことです。つまり、プロトコルを換えるだけで大幅な性能向上が見込めるというわけです。また、Ethernet(RoCE)との比較テストでは、FC のほうが低遅延で、かつ CPU 使用率も小さく抑えられました。

NVMe over Fibre Channel と RoCE の性能と CPU 消費の違い

拡張性と信頼性

まったく同じハードウェア構成で FC と iSCSI を比較しところ、ファブリックが拡大してスイッチ間接続の輻輳が増大したとき、FC の性能劣化は限定的であった一方、iSCSI は顕著に劣化してしまいました。

イーサネットSANはフラッシュを利用した大規模SANに向かない

投資とコスト

既に FC を利用している環境であれば、NVMe 対応のサーバーとストレージを採用すればよく、ファブリックの更新は必要ありません。Ethernet に切り替えるのであれば、2 つのファブリックを運用しなければなりません。また、FC は、障害対応などの工数が少なく済みます。

同一のハードウェアでプロトコルを NVMe に換えるだけで、1.5 ~ 3 倍もの性能を実現できるのです。資産の有効活用においても重要な施策となります。FC は、NVMe の能力を最大限に引き出す、負荷が小さくメリットの大きな技術です。

さまざまなストレージ・ネットワークをサポート

ピュア・ストレージの FlashArray//X は、メラノックスとブロードコムのいずれの NVMe-oF にも対応する “フル NVMe” のストレージです。99.9999% の可用性を誇り、3 PB もの実効容量を 6U サイズで実現できます。ダウンタイムなしでアップデートが可能で、データの移行作業もありません。フォークリフト・アップグレードを不要にする「Evergreen Storage」も特長の 1 つです。

FlashArray

FlashArray//X は、主要なアプリケーションで極めて高い性能を発揮します。Oracle DWH の DSS 書き込み帯域幅は 2.9 倍、SAP 4/HANA の Delta Merge 書き込み帯域幅は 3.7 倍に高速化され、Epic 電子健康記録(EHR)システムの読み込み遅延が 45% も低下することがわかっています。

アプリケーションにとっての利点は?

ピュア・ストレージは、現時点で、以下の次世代ストレージ・ネットワーキングに対応しています。

  • FlashArray//X
    • 16/32 Gbps FC
    • 10/25 Gbps Ethernet(iSCSI)
    • 25/50 Gbps Ethernet(NVMe-oF)
  • FlashBlade(NFS、SMB、Amazon S3 互換)
    • 40 Gbps Ethernet
    • 100 Gbps Ethernet(マルチシャーシ構成時)

ピュア・ストレージは、ストレージ・ネットワーキングにおけるあらゆる要望に応える製品群をご用意しています。

おわりに

The Orange Ring – Tech の今後の開催スケジュールは、ただいま調整中です。決定しだい、本ブログ、ピュア・ストレージの Web サイトおよび Facebook でご案内いたします。

The Orange Ring – Tech ブログシリーズ

第 1 回 新しいストレージのカタチ ─ 高速堅牢なオールフラッシュをクラウドライクに利用する
第 2 回 イマドキのストレージ設計 ─ 容量・性能はどう決める?
第 3 回 データ保護の最後の砦 ー バックアップの考え方
第 4 回 目標は簡素、実効は複雑なストレージマイグレーション


Pure Storage、Pure Storage のロゴ、およびその他全ての Pure Storage のマーク、製品名、サービス名は、米国およびその他の国における Pure Storage, Inc. の商標または登録商標です。その他記載の会社名、製品名は、各社の商標または登録商標です。