PagerDutyとは
PagerDutyは、複数の監視ツールと連携し数多く発せられるアラートの中から、機械学習やルーティングロジックを適用して必要なアラートだけをインシデント化し管理できるツールです。インシデント対応処理が開始されると、その日のオンコールエンジニアや、インシデントに対して適切な対応チームやメンバーに、電話、メール、slackなど様々な手段で通知をいたします。
代表的な課題
01.
運用プロセスの穴
対応フロー、使用するソフトウェア、連絡・確認体制が対応しきれておらず障害に気づくのが遅い。障害の連絡がない。対応者が分からない。ミスや抜けが発生。
02.
膨大なアラート
モニタリングソフトウェアの発信するアラート数が多く、メールの仕分けやチャットツールの確認に時間がかかる。本当に重要なアラートの見落としも。
03.
時間の有効活用
現場は、障害対応に時間がとられ、本業である開発やリリースに集中しづらい。管理者は部下の就業時間や本業の開発速度が課題になりがち。
01.
アプリケーションのアラートを確実に通知
DXによりWebサービスなしでは動かない時代。絶対落ちないシステムはありえないのに、求められるのは24x365「ダウンタイムゼロ」。ただでさえエンジニア不足がひどい昨今。嵐のようなアラートを集約し、確実に適切な担当者に通知されることを実現するのがPagerDutyです。
02.
通知ルールの設定は柔軟に
PagerDutyは監視ツールやアプリケーションからのアラートを受けて、いろいろな方法でインシデントの発生を確実に担当者に通報するシステムです。通報はメールだけでなく音声による電話、SMS、スマホへのプッシュ型メッセージで行うことも可能です。
03.
ご利用中のツールと簡単に連携、APIでアラート通知が可能
PagerDutyはAWSのCloudWatchやZabbix、Nagios、Mackerelなど、多くの監視ツールと簡単に連携が可能です。REST APIでのコールもできますので、特定のアプリケーションを使用したインシデント報告をユーザーがプログラムすることも簡単です。もちろん、アプリケーションからPagerDutyのメール通知設定をすることもできますので、簡単なスクリプトを書くことで複雑なエスカレーションが可能です。
運用状況をレ
ポート機能で可視化
レポート機能でインシデント数や対応に着手するまでの時間、解決までの時間などをリストやグラフで知ることが可能。インシデントが起きやすいアプリケーションやサービス全体の運用状況を定量的に管理するのに役立ちます。
ビジュアル化された
コンソール
Webベースのクラウドサービスなのでハードウェアインフラ・アプリケーション・インシデントの状況をダッシュボードでリアルタイムに確認可能。監視ツールとの連携もコードを書かずにWebインターフェイスで簡単設定。
どこにいても安心
モバイルアプリもAndroid、iOS ともに用意されているので、どこにいても確認・解決・再割り当てが可能。 アプリ・メール・SMS・電話などのマルチチャネル通信オプション使用で、アラートやインシデントの更新を見逃しません。
お客様の声
導入企業
サポート
FAQ
ライセンス、機能、設定について、当社によくいただく質問に回答しています。