NHN Cloud Meetup 編集部
System Monitoringサービスの紹介
2019.10.28
501
System Monitoringとは?
TOASTでは今年7月にSystem Monitoringサービスを新たにリリースしました。クラウドにおいてVMインスタンスを生成し、その上にサービスを構築する場合、システム監視は最も重要な項目のひとつです。
システム監視機能では、通常、ユーザーが介入することなく自動的、かつ継続的にさまざまなシステム指標を収集します。そして、注目すべきイベントが発生したらユーザーへ通知し、イベントが発生した時点のデータが普段とどのように違うのか理解し、イベントの設定や障害の対策に備えられるよう、指標データをグラフ化して提供するような機能を備えています。もし自動化されたシステム監視機能がないと、ユーザーが直接、定期的に指標データを収集し、障害が発生してから指標データを元に経験的に原因を分析しなければなりません。それではサービスの安定性に影響を及ぼしかねない事態となってしまいます。
System Monitoringサービスは、Instanceサービスの補助機能として提供していますが、Instanceごとの「モニタリング」タブからはもちろん、別メニューからアクセスすることもできます。
モニタリングの始め方
まず、エージェント(agent)をインストールして、モニタリングを開始しましょう。Compute> Instanceサービスにアクセスします。VMインスタンスを1つ選択してクリックすると、下部に「基本情報」「接続情報」「モニタリング」領域が表示されます。「モニタリング」タブをクリックすると、システム監視画面が公開されます。
すでにエージェントをインストールして、システム指標を定期的に収集している状況であればチャートが表示され、そうでなければ、エージェントのインストールガイドが表示されます。対象のVMインスタンスに接続して、エージェントのインストールガイドに従ってコマンドを実行すると、エージェントがインストール/実行され、このときからシステム指標を収集します。
システム指標が収集されると、当該タブで次のようなチャートが表示されます。
デフォルトで提供する指標は、CPU使用率と平均負荷、メモリ使用率、ディスク使用率、ディスク転送率、ネットワーク転送率です。
System Monitoringサービスが提供する機能
レイアウトとチャートの管理
System Monitoringサービスのチャートは、別メニューからも確認できます。Compute> System Monitoringメニューにアクセスすると、複数のVMインスタンスのシステム指標を一緒に確認できます。
サーバーダッシュボードでは、複数のVMインスタンスの指標を、あらかじめ定義されたレイアウトに基づいて配置されたチャートから確認できます。
「レイアウト作成」ボタンをクリックして新しいレイアウトを作成したり、「チャート追加」ボタンをクリックして、ユーザーが希望するグラフを追加した後、目的の場所に配置することができます。
InstanceサービスのMonitoringタブから、基本提供されるシステム指標のほかにも様々な指標を確認することができます。追加提供されるシステム指標として、CPU User/System/Nice/IO Wait、メモリUsed/Buffers/Cached/Free、Swap Used/Total、Swap使用率、ネットワーク転送率(pps)、Process Countがあります。
チャートにマウスオーバーすると、特定時間の指標数値を確認できます。またドラッグ&ドロップで拡大して詳細情報を確認することができます。
ユーザーグループの管理
Compute> System Monitoring> ユーザーグループタブでは、システム監視でイベントは発生した際の通知先となるユーザーをグループ別に分けて管理します。イベント発生時に通知を行いたい場合はまずはユーザーグループの作成を行う必要があります。「グループ作成」ボタンをクリックして、グループを作成し、ユーザーを追加することができます。作成したグループは「お知らせグループ」タブで、通知の受信先として使用できるようになります。
お知らせグループの管理
Compute> System Monitoring> お知らせグループタブでは、イベントの監視設定と通知先、通知の種類などを設定できます。
特定のインスタンスのシステム指標が、ユーザーが定義した監視設定のしきい値に到達したとき、イベントが発生したと判断してイベント発生通知を送信します。あらかじめ定義してある受信対象のユーザーグループにSMSやEmailでイベント発生通知を送信し、ユーザーがこれを受信して、システム指標に異常があることを認知できるようにします。どのような指標が設定できるかはSystem Monitoring > コンソール使用ガイドを参照ください。
TOASTのコンソールで監視対象のインスタンス、監視設定(システム指標のしきい値)、受信対象のユーザーグループ、通知タイプなどを、あらかじめ設定しておけば、システム障害やサービスの負荷が突発的に発生した場合もユーザーに通知が届くようになります。