BLOG
PagerDuty Operations Cloudに生成AIを投入

投稿:2023年6月1日   |    更新:2023年6月8日

ビジネスを維持するには、運用アクティビティーを管理・調整し、影響の大きい緊急の作業を優先し、日々の精度を維持する必要があります。ミッションクリティカルで一刻を争う危機対応においては信頼が最も重要であり、エラーの許容範囲が狭いということは、生成AIの誤謬や誤検知の余地や許容度が低いことを意味します。

これが、PagerDutyのロードマップが常にユーザーの仕事を容易にするために設計されたイノベーション、つまり目的を持ったイノベーションに焦点を当ててきた理由です。PagerDutyは長年にわたりAIと機械学習に取り組んでいる、AIOpsの業界リーダーです。そして、PagerDutyが生成AIを評価したのはその視点からでした。生成AIそれ自体を目的とすることではなく、PagerDuty Operations Cloud全体でより多くの価値をどのように解き放つことができるかを自問したわけです。

コード作成の副操縦士からインシデント対応アシスタントに至るまで、生成AIは大きなチャンスをもたらします。生成AIの操作の容易さと優雅さ、つまり自然言語インターフェイスを通じた基本的な直観性により、自動化の可能性を最大限に引き出すステップ関数の機会が生まれます。自動化が生産性と能力を向上させながら時間とお金を節約する可能性があることに疑問の余地はありませんが、自動化の取り組みはそれ自体の抽象化の重みで消滅する可能性があります。

生成AIは、エンタープライズグレードの自動化に消費者スタイルのシンプルさをもたらし、自動化の可能性の実現をより現実的なものにします。ソフトウェア開発のペースはますます加速し、ソフトウェアが増えると複雑さが増し、DevOpsの重要性がこれまで以上に高まります。

ここでは、PagerDutyがPagerDuty Operations CloudにもたらすAIサポートの最初の3つの生成機能を共有します。

生成AIによるステータス更新

計画外に作業が中断された場合、解決にはコミュニケーションと調整が不可欠です。業界のベストプラクティスでは、対応方針を定めるために(少なくとも)30分ごとにステークホルダーとリーダーに定期的にステータスを更新することが推奨されています。しかし、これらのアップデートの作成には時間がかかり、チームのキャパシティーが既に急増しているときには、独自の認知的負荷がかかります。PagerDutyの顧客には、重大なインシデントが発生した際には、ステータス更新だけを担当する専任の担当者が3人いるケースもあります。

ここがPagerDutyの生成AI導入開始に最適な場所でした。ステータス更新機能に生成AIが統合されることで、チームは誰に何を言うべきかのサイクルを保存でき、数回クリックするだけでペルソナベースのステータス更新の下書きを生成できます。この新機能はAIを活用して現在のインシデントに関連する全てのデータを処理し、概要を自動生成して、イベント、進捗状況、課題に関する重要なインサイトを提供します。この機能により、インシデント管理ワークフローが強化され、時間を節約するだけでなくコミュニケーションが合理化され、チームは実際の解決作業に集中できるようになります。

生成AIによるインシデントポストモーテム

ポストモーテムはオペレーショナルエクセレンスの定番であり、サイト信頼性エンジニアリング(SRE)で推進されることが多いベストプラクティスです。これは、何が問題だったのか、どこを改善できるのか、そして最も重要なことに、同じ間違いを何度も繰り返さないようにする方法を知ることができます。

ただし、時間をかけてポストモーテムを文書化するのは難しい場合があります。グループレビューのために関連する全てのデータポイントを収集するのは、時間のかかる手動の(場合によっては感情的な)プロセスです。

しかし、仮想のチームメンバーが最初から最後まで事件を監視しており、そのチームの唯一の仕事がタイムリーで公平なポストモーテム報告書のドラフトを作成することだと想像してみてください。生成AIを適用して包括的なインシデント後の報告書ドラフトの生成を自動化することで、まさにそれが実現できます。

動画でも分かるように、インシデントが解決されると、ユーザーはポストモーテムレビューを生成して、ログ、メトリクス、および関連するSlackまたはMicrosoft Teamsの会話などのインシデントに関する全ての利用可能なデータの収集という時間のかかる作業を、リアルタイムでこなしてくれます。次に、主要な調査結果、根本原因、改善領域を強調した詳細なレポートが作成されます。さらに、PagerDutyは、今後同様の問題が発生するのを防ぐために調整された推奨アクション項目のリストを生成します。

この機能は時間を節約するだけでなく、重要な学習内容を把握するための出発点を提供し、継続的な改善の文化を促進し、チームが将来の校正にさらに多くの時間を費やすことができるようにします。ミッションクリティカルな作業において生成AIの力を解き放つためには、結局は人間が必要、というアプローチです。

上記のステータス更新の例と同様に、自動化されたインシデントポストモーテムでは、専門知識、判断力、監視力を提供する人が必要となり、レポートを広範囲に公開する前に検証して改良する必要があります。

生成AIによるプロセス自動化

PagerDutyは、PagerDuty Operations Cloudプラットフォーム全体で当初から自動化を使用しており、多くのパートナーと提携して、計画外の作業をより迅速に管理および解決できるワークフローを自動化するスクリプトとプラグインを提供しています。PagerDutyユーザーは、クラウドでもオンプレミスでも、インフラストラクチャーの自動化だけでなく、Ansible、Terraform、Power Automateの推進のために毎日PagerDutyを利用しています。ただし、スクリプトとツールがまだ存在していない場合は、実際にスクリプトをコーディングするという面倒な作業を自分で行う必要があります。

しかしそれもおしまいです。PagerDutyでは生成AIを使用して、ユーザーの自動化ニーズに対応する共同作成者を用意しました。これは、チームに追加の開発者がいて、やりたいことを実行する方法を研究し、自動化を作成する仕事をまかせられるようなものです。そして何よりも、お気に入りのスクリプト言語で実行し、ある言語から別の言語に簡単に移行できるため、最終的には完全に制御できます。PagerDutyは、パワーや柔軟性を失うことなく、これまでハイコードであったエクスペリエンスにローコード機能をもたらします。例えば、「特定のユーザーをOkta内のグループに追加する自動ワークフローを作成してください。実行時にメールとグループでユーザーを指定できるようにしてください」と生成ボタンを押して、魔法が起こるのを見てください。

PagerDutyは、生成AIが学習を加速し、労力を排除して生産性を向上させながら、より多くの創造性を発揮できるようになる旅の初期段階にいます。

新しいテクノロジーにはリスクが伴います。長年にわたってプラットフォーム全体にAI、機械学習、自動化機能を導入してきたように、そのリスクの適切な管理はPagerDutyのDNAに組み込まれています。だからこそ、「人間が関与する」ことがPagerDutyのAI研究における中心的な理念となっているのです。だからこそ、迅速に取り組んでいながらも、PagerDutyでは忠実性、セキュリティー、正確さの原則を念頭に構築に取り組んでいます。

可能性は無限です。皆様からのフィードバックやご意見をお待ちしております。最も重要なことは何でしょうか? これらの機能のウェイティングリストに登録して、開発の最新情報を入手してください。今後数力月以内にこれらの機能のリリースを開始する予定です。

この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

book-markカテゴリー :ニュース&告知