最先端のストレージ監視-迅速な障害対応や将来予測が可能に

The Orange Ring – Tech セミナー第 8 回『Pure1 ベスト・プラクティス』では、ストレージ管理/運用監視ツール「Pure1」を用いたストレージ監視について解説しました。

Pure1 ベスト・プラクティス

はじめに

ピュア・ストレージ・ジャパンは、お客様のデジタル変革を支援する取り組みの一環として、技術セミナー「The Orange Ring – Tech」を開催しています。2019 年 10 月 25 日に開催した第 8 回『Pure1 ベスト・プラクティス』では、ストレージ管理/運用監視ツール「Pure1」を用いたストレージ監視について、わたくし川合が解説しました。また、ゲスト・スピーカーとしてお招きした、シスコシステムズ合同会社 データセンター/仮想化アーキテクチャ SE 本部 テクニカルソリューションズアーキテクト 加藤 久慶氏に、両社で共同開発したコンバージド・インフラストラクチャ「FlashStack」について解説していただきました。本稿では、セミナー当日の内容を抜粋してご紹介します。

全てのログ情報がクラウドに集約されるメリット

昨今のストレージ運用は高度化が進んでいますが、依然として、ローカル環境の監視ツールを用いて SNMP や CLI 、REST を介して情報を取得するという手法が主流です。この従来型手法の場合、リプレースのたびに監視ツールへ組み込む作業が発生しますし、監視そのものも属人的な作業になりがちです。専用の監視ツールを有償で提供しているストレージ・ベンダーもあります。

こうした中、クラウドでログを管理するという手法が広まりつつあります。ピュア・ストレージが提供している Pure1 は、近代的なストレージ運用を提供するクラウド型管理ツールの代表例です。ハードウェア情報や性能、容量情報といったストレージの構成情報のログをクラウド環境に格納しているため、いつでもどこからでもストレージの状態を確認するためにアクセスでき、スマートフォンでもスムーズな状態監視が可能です。

障害対応においても、クラウド型監視はさまざまなメリットが得られます。では、何らかの問題が発生した場合を考えてみましょう。

  1. サポート担当者から確認依頼があってケースをオープンする
  2. サポート・エンジニアをアサインする

問題が発生して最初に行われる 1 と 2 の手順は、従来型監視でも Pure1 のようなクラウド型監視でも同様です。

従来型監視の場合:

  1. ユーザーはローカル環境からログを取得し、大きなサイズのログファイルを送付する
    → サポート・エンジニアは、調査に必要な情報が集まるまで何度もログの取得を依頼する
  2. ユーザーから送られてきた情報をもとに、構成と性能ログを調査する
  3. 情報が不足していて調査が難航すれば “再現待ち” の状態になるおそれあり

クラウド型監視(Pure1)の場合:

  1. アサインされたサポート・エンジニアが、ユーザーと煩雑なやり取りをすることなく構成や性能情報を調査する
    → Pure1 は 30 秒ごとにログを取得しているため、エンジニアは直近の状況から調査を開始することができる
  2. 障害の原因をすばやく特定してユーザーへ報告する

クラウド型監視で障害対応の時間を短縮

クラウド型監視では、従来型監視の手順にある「3. ユーザーはローカル環境からログを取得し、大きなサイズのログファイルを送付する」が不要となり、簡素化されています。この違いが、クラウド型監視の大きなメリットの 1 つです。

クラウドベース・ストレージ管理ツール「Pure1」はサポートの性質をがらりと変える

ピュア・ストレージの FlashArrayFlashBlade には、GUI 管理ツール「Purity GUI」が搭載されており、健全性データやシステム・ボリューム単位の性能・容量情報などの監視を従来どおりにローカルで実施できます。最長で 1 年分のデータが格納されているため、インシデント対応にも役立ちます。

加えて上述したように、Pure1 へ 30 秒ごとにログを送付して保管することが可能です。1 日でおよそ 5 ~ 6 GB のログが記録されます。ピュア・ストレージのサポート・チームやサポート・パートナーは、Pure1 に格納されたデータを参照し、スムーズにサポート・サービスを提供します。また、スマートフォン・アプリを活用して外出先や自宅から稼働状況をモニタリングできます。

Pure1 ―クラウドベースのシンプルな運用監視

ピュア・ストレージ製品に障害が発生すると、ユーザー、サポート・チーム、サポート・パートナーに情報が通知されます。同時にサポート・チケットが作成され、エンジニアがアサインされます。何らかのツールを仕掛ける必要はなく、全関係者がリアルタイムに状況を把握できる点が、一般的な運用監視手法と大きく異なるところです。

Pure1 は、大きく分けて 3 つの要素から構成されています。

  • マネジメント(管理)-メインのグローバル・ダッシュボードのほか、モバイル・ダッシュボードも実装されており、性能解析やハードウェア監視といった機能を備える
  • サポート-ピュア・ストレージのプロアクティブなサポート・サービスや、他社製品と連携する API を含む
  • アナリティクス

Pure1 の三大要素-マネジメント、サポート、アナリティクス

Pure1 に情報が集まるから高度な分析・予測が可能に

Pure1 の構成要素の 1 つであるアナリティクスには、ワークロードのシミュレーションや仮想化環境の分析といった機能が実装されています。これらは Pure1 上にデータが集まっているからこそ実現可能な機能と言えます。

ピュア・ストレージでは、世界中に設置された 1 万台以上のアレイから 1,000 を超える項目のデータを蓄積し、傾向を分析しています。アレイの内外には複数のレベルのセンサーが搭載され、 1 日あたり 1 兆ものデータポイントを提供しています。2019 年時点までには、10 PB 超ものデータレイクが形成されています。この「Pure1 Meta」を活用して、障害予兆検知やリソースの消費傾向、枯渇予測などの情報を提供しているのです。

例えば、障害予兆検知では、問題の発生が予測されるパターンのログをシグネチャ(Issue Fingerprint)として作成します。このシグネチャを基にアレイのスキャン(Real time scanning)を実行し、もし一致するようであれば問題が発生する可能性が高いものとしてサポートに通知され、自動的にケースが登録されて修正などの対処が行われるというわけです。

障害予兆探知と対策

Pure1 にはキャパシティ・プランニング機能「Pure1 Planning」も実装されています。膨大なデータを基に AI 技術を活用して、性能や容量の将来予測をするものです。加えて、コントローラをアップグレードしたときや容量を増設したときに、リソースがどのように変化するのかをシミュレーションすることも可能です。さらに、あるボリュームの負荷が増えたときの状態変化を予測する「ワークロード・シミュレーション」や、特定のボリュームを異なるアレイに移動したりクローニングしたりしたときのキャパシティの変化を予測する「ボリューム移動シミュレーション」といった機能も搭載されています。

VMware 仮想化環境の性能情報をフルスタックで確認できる「Pure1 VM Analytics」機能も有用です。ストレージ性能情報を収集するとともに、VMware vCenter から vSphere 環境の性能情報を取得し、Pure1 へ送付して統合的に解析することが可能です。vCenter から取得した仮想ディスク、仮想マシン、ハイパーバイザー、データストアの情報と FlashArray から取得したボリューム、アレイの情報を突合して各レイヤーのどこで性能問題が発生しているかを直感的に特定することができます。仮に、仮想マシンに問題があれば、対象の仮想マシンをクリックすることでどの経路のどの領域を利用しているのかを瞬時に把握できるため、容易に障害ポイントの切り分けが可能になります。

Pure1 VM Analytics

次世代のコンバージド・インフラストラクチャ シスコとピュア・ストレージの「FlashStack」

シスコシステムズはピュア・ストレージと共同で、コンバージド・インフラストラクチャ「FlashStack」を開発しました。検証済みの構成でサポートが一貫しているというコンバージド・インフラストラクチャの特長に加えて、クラウド型の管理ツールやアプリケーションを基準としたデザイン・ガイドが提供されている製品です。

IT 技術は、めまぐるしく変化しています。例えば、ストレージに最新の NVMe 技術を選んだとき、どのようなネットワーク構成にすべきかという疑問が生じます。そういった課題に対応するため、運用管理を含むトータルのベスト・プラクティスとして FlashStack は開発されました。

FlashStack のコンピューティング・ノードには、「Cisco UCS」が採用されています。筐体にはスイッチ(Fabric Interconnect)が組み込まれており、そのスイッチを介してサーバーを管理するというアーキテクチャが特長です。またネットワークには、Ethernet スイッチ「Cisco NEXUS」および、 FC スイッチ「Cisco MDS」が採用されています。

シスコシステムズ合同会社 提供スライド「FlashStack アーキテクチャ」

シスコシステムズ合同会社 提供スライド「FlashStack アーキテクチャ」

Cisco UCS の特長

  • ケーブリングがシンプルなため作業時間を短縮
  • UUID、WWN、MAC、BIOS 設定など、ハードウェア固有情報の抽象化が可能
  • 抽象化された情報を利用することで、サーバーに依存した設定が不要

Cisco NEXUS、Cisco MDS の特長

  • 一度ケーブル結線すれば、継続アップグレード
  • 容易な拡張性
  • Open APIs
  • ワークロードの集約

FlashStack は共通基盤であるため、どのようなワークロードでも性能よく利用できます。20 以上の主要なアプリケーションに対してデザインガイド「Cisco Validated Designs」が提供されており、搭載するシステムが増えてリソースが必要になったときでも、サーバー、スイッチ、ストレージを柔軟に拡張・強化させることが可能です。管理ポイントが Fabric Interconnect に集約されており、拡張に応じて増えることがないというのが最大のポイントです。

シスコシステムズ合同会社 提供スライド「Cisco Validated Designs」

シスコシステムズ合同会社 提供スライド「Cisco Validated Designs」

FlashStack にはクラウドベースの統合管理ツール「Cisco Intersight」が提供されています。これは、ピュア・ストレージの Pure1、Cisco UCS 向けの「Cisco IMC」、Fabric Interconnect の「UCS Manager」といった管理ツールを統合し、時間や場所に縛られることなくインフラ管理を可能にするものです。シスコシステムズのサポート・サービス(TAC)と連携し、ケース・オープンからパーツ交換などの対処までを自動化する機能も搭載されています。

Cisco Intersight で統合管理

  • Pure1:ストレージの管理
  • Cisco IMC:UCS サーバーの管理
  • UCS Manager:Fabric Interconnect、ブレードサーバ、ラックマウントサーバの管理

シスコシステムズ合同会社 提供スライド「自動障害対応:Cisco Intersight + TAC」

シスコシステムズ合同会社 提供スライド「自動障害対応:Cisco Intersight + TAC」

現在、ピュア・ストレージでは、Cisco Intersight 専用の FlashArray デバイス・コネクタを開発中です。単なる管理機能の連携だけでなく一部のタスクやワークフローに対応し、運用作業の自動化も可能になる予定です。

おわりに

The Orange Ring – Tech 第 7 回『ストレージ運用入門』では、ストレージ運用にはどのような問題が発生するのかという観点から、現代のストレージ運用に必要な技術や機能について解説しています。ぜひあわせてご覧ください。

The Orange Ring – Tech の今後の開催スケジュールは、ただいま調整中です。決定しだい、本ブログ、ピュア・ストレージの Web サイトおよび Facebook でご案内いたします。

The Orange Ring – Tech ブログシリーズ

第 1 回 新しいストレージのカタチ-高速堅牢なオールフラッシュをクラウドライクに利用する
第 2 回 イマドキのストレージ設計-容量・性能はどう決める?
第 3 回 データ保護の最後の砦-バックアップの考え方
第 4 回 目標は簡素、実効は複雑なストレージマイグレーション
第 5 回 NVMe を最大限に活かすストレージ・ネットワーキングとは
第 6 回 AI/ビッグデータをビジネスに活かすには-統合ストレージの重要性
第 7 回 ストレージ運用の問題はアーキテクチャから解決する


Pure Storage、Pure Storage のロゴ、およびその他全ての Pure Storage のマーク、製品名、サービス名は、米国およびその他の国における Pure Storage, Inc. の商標または登録商標です。その他記載の会社名、製品名は、各社の商標または登録商標です。