あらゆるものがデジタル化された世界で、チームはますます複雑さを増しています。システムやプロセス間の依存関係がますます大きくなり、顧客や従業員の体験はもちろん、収益も危険にさらされています。人間が重要なものを理解したり問題の発生を知ったりするためにはデータの選別と関連付けが不可欠ですが、データが多すぎるのです。
デジタルの複雑性と依存性が高まる中で、あらゆることに対応できるようにするには、手動、硬直的、チケットキュー方式のオペレーションを、顧客体験に焦点を当て、処理スピードと回復力を実現し、機械学習とAIで大幅に自動化して強化された継続的改善システムへと変革する必要があります。そうして初めて、チームはよりプロアクティブな姿勢に移行し、手作業の負担を軽減し、燃え尽き症候群を回避し、集中力を維持できます。
PagerDutyのミッションは、オペレーションに革命を起こし、チームが事後対応や不具合の修正に費やす時間を減らし、新しいイノベーションを提供する時間を増やすとともに、望ましい回復力の目標を達成できるようにすることです。私たちは、このオペレーションの未来が、ソフトウェアの構築と運用を行うデジタルチームだけでなく、組織内の全てのチームにまで広がっていくと考えています。
Summit 2022では、このビジョンに向けたPagerDuty Operations Cloudのいくつかのアップデートを発表しています。
あらゆる場所で自動化を実現
PagerDutyは、お客様の業務の自動化を支援します。PagerDutyを使用することで、組織は緊急のITインシデント、顧客の課題、そして緊急でない日常業務への対応を加速することができます。
本日開催されたPagerDuty Summitにおいて、PagerDutyはカスタムインシデントレスポンスワークフローを作成するための新しい自動化機能、レスポンダーを重要な問題に集中させる方法、自動診断と修復によるMTTRのスピードアップ、顧客サービスエージェントが顧客をプロアクティブにサポートする力の向上を発表しています。
Incident Workflow。 まず、PagerDutyが強力なCatalyticワークフローエンジンを統合し、カスタマイズ可能なIncident Workflowをサポートすることをお知らせします。Incident Workflowは、レスポンダーの追加、ステークホルダーの登録、電話会議ブリッジの開始といった一般的なインシデントアクションのシーケンスを、オーケストレーションされたレスポンスに設定するためのワークフローロジックを定義します。これらのワークフローは、優先度の変更などの一般的なイベントをトリガーとして、自動的に実行されます。PagerDuty Incident Responseの新機能については、サマリーをご覧ください。
Auto-Pause Incident Notifications。 また、レスポンダーは自動化によって不必要な混乱を避けることができます。PagerDuty Event Intelligenceを使用すると、レスポンダーはAuto-Pause Incident Notificationsで一過性のノイズを抑制することができます。この機能は、過去に自動解決してきた一時的なアラートを機械学習を適用して自動的に検出し、一時停止します。このようなタイプのアラートを経験するお客様にとって、この機能はチームの生産性を向上させる上で大きな違いをもたらします。自己修復する類のものに起こされることなく、安眠することだって可能です。リリース後わずか3カ月で、Auto-Pause Incident Notificationsは35万件以上のフラッピングアラートを一時停止させました。
Auto-Pause Incident Notificationsについては、弊社ウェブサイトで詳しく説明しています。 ** どこでもAutomation Actions。** 私たちは、第一レスポンダーを支援する上で、自動化によって一般的な問題の診断と修復を行えるようにしたいとのお客様の声を聞いてきました。昨年、私たちはPagerDutyから直接安全に自動化を呼び出すためのPagerDuty Automation Actionsを導入しました。そして今回、PagerDutyのモバイルアプリとSlackでAutomation Actionsを利用できるようにしました。レスポンダーはどこにいても問題を迅速に解決できるようになり、この自動化の結果を共有することで、インシデントチームとのコラボレーションも容易になりました。
しかし、一般的な診断を実行するためにレスポンダーを待つ必要はないでしょう。Event Orchestrationのユーザーは、最初のレスポンダーがインシデントを認識する前に同じ自動診断をプロアクティブに起動し、より速い初動のために必要な情報を提供できるようになりました。これらの同じトリガーは、既知の問題に対して自己修復を試みることもでき、最も可能性の高い解決法で効果がなかった場合にのみ、人間にメッセージを送ることができます。
最後に、この機能を拡張して、カスタマーサービスチームに自動化を提供できるようにしました。カスタマーサービス担当者は、PagerDuty Customer Service Opsから自動検証テストを呼び出して、顧客の問題がシステムの問題に関連しているかどうかを判断し、顧客の体験に影響を与える可能性のある既知の問題についての情報を積極的に受け取ることができるようになりました。
詳しくは、Automation Actionsの最新情報ブログ記事をご覧ください。
PagerDuty Runbook Automation。 PagerDutyは、最近発表したSaaSサービスPagerDuty Runbook Automationを通じて、お客様が自動診断、修復、日常業務のオーケストレーションをより容易に行えるようにします。PagerDuty Runbook AutomationはPagerDuty Process Automationソフトウェアをベースにしており、クラスターをホストすることなく同じ開発・実行環境にアクセスすることが可能です。そのプラグインにより、チームはインフラをノードとして簡単に組み込むことができ、エンドツーエンドのオーケストレーションされたジョブ定義で自動化を再利用することができます。
インシデント対応、顧客サービス、開発者体験、およびコンプライアンスを高速化するためのビジネスに関連した自動化を、PagerDuty Runbook Automationを使用して作成しましょう。
全ての人と物をつなぐ
現代のデジタル環境では、さまざまなシステムの数が爆発的に増加しています。何が起きていて、何に注意を払う必要があるのかを完全に把握するためには、システムとチームを同期させておくことが肝要です。PagerDuty Operations Cloudは、API、ウェブフック、および650を超えるインテグレーションにより、お客様の技術スタックと統合し、チームがより良く連携してお客様により良い体験を提供できるようサイロを解消します。
ステータスアップデートの通知テンプレート。 PagerDutyに、社内のステークホルダーに最新情報を提供する新しい方法が追加されました。インシデント対応中の社内コミュニケーションを、HTMLテンプレートを使って標準化することができるようになりました。例えば、リッチテキストエディターでレスポンスをカスタマイズし、画像、スクリーンショット、グラフを追加することができます。ステータスアップデートの通知テンプレートについて詳しくはこちらをご覧ください。
PagerDuty for Salesforce Service Cloudの更新情報。 カスタマーサービス担当者は、インシデント発生時に最前線にいるため、暗闇に取り残されるようなことがあってはなりません。そこで、PagerDuty Customer Service Operationsの出番です。
PagerDuty for Customer Service Operationsは、Salesforce Service Cloudとの連携を深めることで、DevOps、ITOps、カスタマーサービスチームとSalesforce Incident Objectsおよびケースとの間にリアルタイムのリンクを作成します。これにより、全てのチームが1つの真実の情報源となるのです。エージェントは、顧客に影響を与える問題を解決するために、チーム間で協力し合うことができるようになりました。PagerDuty Customer Service Operationsのアップデートについて、詳しくはこちらです。 ** CollabOpsのアップデート。** CollabOpsは、多くのチームがリアルタイムで作業やコミュニケーションを行う方法となっています。私たちは、Slackとの統合を単一の接続管理ページで簡素化しました。そしてGoogleは最近、新しいインテグレーションを構築しました。PagerDuty for Google Chatです。PagerDuty for Google Chatの詳細についてはこちらをご覧ください。
スピードと柔軟性を実現する
インシデント対応というと、迅速さとは無縁に感じられることがよくあります。情報を得るためにシステム間を移動したり、通知を手動で確認したり、必要なものを見つけるためにインターフェイスを調べたりする時間は、往々にして無駄になってしまいます。チームが集中できるようにすることで、作業と解決までの時間を短縮できます。だからこそ私たちは、レスポンダーが必要なものを必要な場所で必要なだけ素早く入手できるように設計された機能を優先的に構築し、PagerDutyがお客様それぞれのインシデント対応プロセスへのユニークなアプローチに途切れることなく合わせられるようにしたのです。
インシデントのカスタムフィールド。 それは、最も必要な場所に情報を置いておくことから始まります。本日、PagerDutyはインシデントにおけるカスタムフィールドを発表しました。カスタムフィールドは、API、ウェブ、モバイルアプリ、SMSなど、どのような場所からでも重要なコンテキスト情報へのアクセスを可能にします。カスタムフィールドに引き出されたより多くの情報により、レスポンダーは問題をより迅速にトリアージし、解決できます。
PagerDutyモバイルアプリのアップデート。 また、PagerDutyモバイルアプリのホーム画面も一新しました。レスポンダーにとって重要な情報が一目瞭然になり、インシデントの解決がさらに加速します。レスポンダーはワンタップで詳細を確認し、アクションを起こすことができます。カルーセルには全てのオプションが表示されるため、レスポンダーは外出先でも状況を把握することができます。この機能は現在アーリーアクセス中です。アクセスするには、ここでアカウントにサインアップしてください。
Event OrchestrationのTerraformサポート。 Event Orchestrationは、複雑なロジックとルールの入れ子を利用することで、手動によるイベント処理を削減することができます。10個のイベントルールを1個のEvent Orchestrationに置き換え、90%の効率化を実現しているお客様もいます。
Infrastructure-as-Code実践の一環としてEvent Orchestrationを使用するのにTerraformのサポートを充実を希望するお客様の声を取り入れました!Terraformでオーケストレーションを構成し、大規模のオーケストレーションの作成、管理、変更を簡単に行えるようになりました。Terraformプロバイダーのドキュメントを確認してください。
継続的な改善
インシデントは、解決して終わりではありません。カルチャーに投資し、ベストプラクティスを導入し、過去のインシデントから学ぶことで、チームは回復力を高めることができます。
Service Standards。 デジタル業務の成熟に伴い、お客様はしばしば「良い」の基準をチーム全体で標準化したいと考えるようになります。Service Standardsを利用することで、チームはベストプラクティスに従ってサービスを構成することができます。例えば、アカウント所有者は、サービスの依存関係や、複数のレベルを持つサービスのエスカレーションポリシーなどを監査することができます。Service Standardsは、組織全体にわたってサービスオーナーシップを拡張するためのカスタムガードレールを提供します。Service Standardsについて詳しくはこちらをご覧ください。
次世代レポート。 より積極的な運用体制の構築は、現状把握から始まります。そこから、チームは微調整や改善の機会を特定することができます。PagerDutyでは、新たにレポート機能が強化され、データに基づいてより良い意思決定ができるようになりました。
まず、Service Performance Reportに、新しいインタラクティブな可視化機能、直感的なサービスのドリルダウン機能、インシデントの解決にかかる時間を測定する新しいResponse Effortメトリック、インシデントの優先順位付けに役立つフィルタリングオプションが追加されました。Incident Activity、Escalation Policy、Responder Healthレポートの更新にご期待ください。
この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。