Blog
ブログ

2018年6月13日  (更新日:2022年3月11日)

Zenoss 5インテグレーションガイドを追加しました

Zenossは、普及しているオープンソースネットワーク、サーバーおよびアプリケーション監視システムです。あらゆるオープンソース監視システムで利用可能な最高のイベント管理システムの1つを提供します。Zenossのプラグインアーキテクチャにより、誰でも簡単に利用できるようになりました。PagerDutyは、PagerDuty APIを使用してオンコールスケジュール、アラート、インシデント追跡を提供することで、Zenossの機能を拡張します。 このガイドでは、Zenoss 4のインストールをPagerDuty ZenPackにインテグレートする方法について説明します。

詳しくはこちら

続きを読む
インテグレーション&ガイド
2018年6月11日  (更新日:2022年3月11日)

SaltStackインテグレーションガイドを追加しました

SaltStackは、構成管理からサーバー自動化、監視サービスまで、幅広い機能とリモート実行を組み合わせた先進のシステム管理フレームワークです。 このドキュメントでは、SaltStackのリモート実行および構成管理ツールをPagerDutyとともに使えるように構成する方法について、詳しく説明します。

詳しくはこちら

続きを読む
インテグレーション&ガイド
2018年6月8日  (更新日:2022年3月11日)

Puppet インテグレーションガイドを追加しました

Puppetは、ソフトウェアがどこで実行されるかに関係なく、標準的な方法で配布・稼働できるようにします。 Puppetのアプローチでは、可読性の高い共通の言語を使用して、アプリやインフラストラクチャの外観を定義します。 それを基に、データセンター全体で実施したい変更、共有、テストを実施できます。 また、あらゆる段階で、意思決定とコンプライアンスの証明に必要な可視性とレポートを提供する機能を備えています。

詳しくはこちら

続きを読む
インテグレーション&ガイド
2018年6月6日  (更新日:2022年3月9日)

Detectifyインテグレーションガイドを追加しました

DetectifyはSaaSベースのWebアプリケーションサービスで、Webサイトのセキュリティステータスを分析し、結果を含むレポートを作成します。 このインテグレーションによって、システム管理者またはサポートチームにアラームを直接送信することができます。

詳しくはこちら

続きを読む
インテグレーション&ガイド
2018年6月4日  (更新日:2022年3月11日)

Red Canaryインテグレーションガイドを追加しました

Red Canaryは、最先端のエンドポイント検出技術と、他のセキュリティツールに欠けている脅威を検出するために必要な人間の専門知識を組み合わせることで、Fortune 100クラスのセキュリティをあらゆる組織にもたらします。Red Canaryの独自のエンドポイント検出および対応ソリューションは、組織全体で何が起きているのかを理解し、エンドポイントを脅威から守るために必要な情報を顧客に提供します。

詳しくはこちら

続きを読む
インテグレーション&ガイド
2018年6月1日  (更新日:2022年3月11日)

NetBeezインテグレーションガイドを追加しました

NetBeezは、ネットワークの遠隔の有線または無線のユーザのエンドユーザステータスとアプリケーションの有効性を報告するネットワーク監視ツールです。

詳しくはこちら

続きを読む
インテグレーション&ガイド
2018年5月31日  (更新日:2022年3月10日)    |    インテグレーション&ガイド

Errorceptionインテグレーションガイドを追加しました

Errorceptionは、JavaScriptのエラーがユーザーのブラウザで発生しているのを見つけるために一番簡単な方法です。ページにスクリプトタグを挿入するだけで、リアルタイムで発生するエラーを記録することができます。Errorceptionのサービスフックを設定することにより、ErrorceptionからのJSエラー通知をPagerDutyインシデントとして受け取ることができます。

詳しくはこちら

2018年5月29日  (更新日:2022年3月11日)    |    インテグレーション&ガイド

Site24x7インテグレーションガイドを追加しました

Site24x7は、Webサイト、オンラインアプリケーション、サーバ、パブリックやプライベートクラウドのすべてのアップタイムとパフォーマンスを1台のコンソールから監視するのに役立つクラウドインフラ監視サービスです。PagerDutyとSite24x7とのインテグレーションにより、Site24x7からのWebサイトアラートを直接受け取ることができます。

詳しくはこちら

2018年5月28日  (更新日:2022年5月19日)    |    ベストプラクティス

DNSmetrics:複数のDNSプロバイダから統一したメトリックを集める

マネージドDNSプロバイダーからメトリックを収集して変換するためのツールをオープンソース化して皆様とシェアできたことを喜びに思います。私たちは現在DNSmetricsを使用して、SREチームの監視、警告システムに標準形式のデータ提供を行なっておりますが、この方式が皆さんのお役にも立てると信じております。

DNSの主な役割

PagerDutyでは、サービスの信頼性と可用性を重視しております。可用性は私たちの内部インフラの設計に重要であるだけでなく、私たちが所有していないインフラにも同じ要件を適用する必要があります。 PagerDutyは外部のプロバイダーをいくつかの不可欠なインフラコンポーネントに活用しています。本日はこれらの1つについて説明します。

ドメインネームシステムは、pagerduty.comのようなドメイン名を、APIやWebアプリケーションが要求する数字のネットワークアドレスに翻訳します。アドレスは変わる可能性があるため、ほとんどのシステム(とほとんどの人)は数字ではなく名前を使用します。そのため、私たちのドメインの DNSが利用できない場合、多数のお客様は私たちのサービスに到達できなくなるので、DNSを使用可能にして正しく構成することが重要です。

DNSプロバイダはこれを理解し、高可用性システムのグローバルネットワークを維持しています。しかし、DNSの性質上、大規模なシステムは間違いなくDoS攻撃の影響を受けやすくなります。実際、有名なマネージドDNSプロバイダの大部分は、過去数年間に少なくとも1つの大きなサービスの混乱を経験しています(例:1、2、3、4)。PagerDutyは過去に単一のプロバイダを使用していましたが、我々はもはや十分に頑強であるとは言えません。現在ではアクティブ―アクティブ構成(各プロバイダーが運用トラフィックの半分ずつを担当する)で、DNSニーズに対して2つのプロバイダーを使用しています。

DNSメトリックを何のため構築し、どのように役立つのでしょうか

両方のDNSプロバイダに監視と警告を設定するのは難しいことでした。各プロバイダは、管理インタフェースでオーバービューとレポートを提供していますが、公開されているメトリックの選択、異なるインタフェース内の同じデータの場所、平均とレポートに使用される時間間隔など、レポートはプロバイダによって異なります。プロバイダやゾーン全体でDNSの状態のスナップショットを得るために多くの努力とさまざまな表示画面が必要で、我々はアラート機能のために自らのツールを使用したいと考えました(いずれのプロバイダーも当社の総トラフィックの一定割合以上を取得していないことを追跡します)。

私たちにはもっと良い解決策が必要でしたが、利用可能なものはなかったので、構築することにしました。これは、APIを使用して両方のDNSプロバイダに接続し、関心のある指標を引き出すサービスです。これらのメトリックは、同じ名前空間とユニットに正規化され、標準的な統計形式で発行され、任意の時系列モニタリングシステムに取り込まれます。

2つの異なる管理インターフェイスとそれぞれの複数の画面ではなく、すべてのプロバイダとゾーンを集約したDNSの正常性の概要を示す単一のダッシュボードが作成されました。

さらに、時系列のメトリックを1か所に配置したので、時系列クエリ(我々の場合はDataDogモニタ)の豊かな表現力を適用して、すべてのプロバイダでDNSの柔軟なアラートをプロバイダごと、ゾーンごとに設定できます。

マネージドDNSプロバイダを監視することは、PagerDutyのSREチームだけの問題ではありません。そのため、オープンソースのDNSメトリクスを採用することにしました。現時点では、使用しているプロバイダのみをサポートしていますが、他のプロバイダにカバレッジを拡張するには、一般的に使用されているメトリックを公開するREST APIがあれば簡単です。 DNSメトリックを試してみるのは、Dockerコンテナを実行するのと同じくらい簡単です。スピンを加えて環境内の場所を探すこともできるかもしれません。

本記事は米国PagerDuty社のサイトで公開されているブログをそのまま日本語に翻訳したものです。原文はこちらを参照してください。

2018年5月21日  (更新日:2022年3月11日)    |    インテグレーション&ガイド

Nagios XIインテグレーションガイド – エージェントレスを追加しました

Nagiosはコンピュータシステムおよびネットワークの監視のためのツールです。指定されたノードとサービスを監視し、問題が発生したり解決したりした時にユーザーに通知します。PageDutyと連携させることで、細やかな通知と履歴管理などができるようになります。このガイドでは、専用のエージェントを使用して、Nagios XIインストールとPagerDutyをインテグレートする方法について説明します。CentOS 5でNagiosを実行している場合、 Nagios XIのPerlベースインテグレーションをご使用ください。

詳しくはこちら

2018年5月17日  (更新日:2022年10月13日)    |    インシデント&アラート

HOW-TO:Twitterトレンド・アラート・システムの作り方

こんにちは!私はリチャード・チャオ、PagerDutyのプラットフォームチームのソフトウェアエンジニアリング部門でインターンをしています。私はワーテルロー大学でコンピューター工学を学ぶ2年生でもあります。この記事では、2018年のMarch Hackdayプロジェクトを紹介します。最小限のコーディング知識でTwitterトレンドのアラート・システムを40分以内で作成できるガイドです。

PagerDutyを活用してTwitterで自分のブランドを監視するシステムを作る―しかも40分以内で

ソーシャルメディアの時代、ブランドの評判の管理より複雑なことはありません。公開企業の66.7%がTwitterでメンションする中、あなたは適切なタイミング、例えば顧客が最もよく見ている時間に興味深く影響力のあるコンテンツを宣伝したいとします。それと同時に、主要なPR活動を監視して迅速にチームを動員できるように準備させておき、ブランドが顧客と収益を失わないようにしたいとします。そのために必要とされるものは競争力です。それは、チャンスなのかトラブルなのかに関係なく、ソーシャルメディアで何かが起こったらすぐにそのトレンドのトップに立つことを意味します。

導入事例

今日は、ほとんどの人はToronto Raptors(訳注:カナダ・オンタリオ州トロントに本拠を置く全米プロバスケットボール協会所属のチーム)について話しているようです。おそらく、これはぼくらのジャージの5割引セールを宣伝するのにベストなタイミングでしょう。

PagerDutyソリューション

ほとんどの企業はPagerDutyを使い、顧客に影響を与える不具合の管理や、適切な対応者へのアラート送信、インシデントが従業員と顧客満足度に及ぼす影響の分析などを行っています。

しかし、PagerDutyをTwitterのトレンド・アラート・システムとして活用できることも知っているのでしょうか?

PagerDutyの良いところは、ニーズに合わせて簡単に拡張できることです。このガイドの最後まで行けば、Twitterのキーワード、メンション、リツイートをリアルタイムで追跡し、ソーシャルメディアの活動が急増したときにeメール、SMS、または電話で即座にアラートする自動化されたアプリケーションができ上がっています。一番おいしい点は、これにかかる時間は40分以下で、コーディングに関する知識もほとんど必要ないことです。では、早速作業に入りましょう。

ステップ… 別名 “Engineering Stuff”

ステップ1:Twitterアプリケーションを設定します。

新しいTwitterアカウントの作成 このプロジェクトにはあなたの会社のTwitterアカウントを使用する必要はないので 、セキュリティとテストのため新しいTwitterアカウントを作成することをお勧めします。 Twitter APIキーの取得 メールを確認してください。 Twitter APIを使用するには、Twitterがアプリケーションをあなたのアカウントに関連付けるためのトークンが必要です。https://apps.twitter.com/にアクセスして新しいアプリを作成します。 Keys and Access Tokensタブの下で、トークンを生成します。後でキーをコピーできるように、このタブを開いたままにしておきます。

あなたのTwitterアカウントを開発用に設定する必要があります。

ステップ2:プロジェクトコードをダウンロードします。

PagerDutyはGitHubを使用してコードリポジトリの管理をします。

プロジェクトコードをダウンロードするため、Gitがインストールされていることを確認してください。 https://github.com/pagerduty/twitter-trend-alert-system にアクセスしてください。ターミナル/CMDで、”git clone https://github.com/pagerduty/twitter-trend-alert-system ”を実行してプロジェクトコードをダウンロードします。 このプロジェクトはPython 2.7.14を使用しています。インストールしていない場合は、https://www.python.org/downloads/にアクセスしてください。 “pip -version”と入力してインストールを確認してください。

プロジェクトを設定するには、READMEに記載されている指示に従ってください。この時点ではDatadog APIキーが欠落しているはずです。

ヒント: このガイドでは、ローカルコンピュータでプロジェクトを実行します。これを無期限に実行したい場合は、小さなサーバーで実行することをお勧めします。

この作業が完了する前に、Twitterに投稿されたすべてのステータスをフィルタリングし、リストされたキーワードを含むステータスのみを返すプロセスがあります。

ステップ3:PagerDutyを設定します

あなたの会社が現在PagerDutyを使用していない場合は、https://signup.pagerduty.com/accounts/newにアクセスして無料の14日間の試用アカウントを作成する必要があります。

オンボーディングページはスキップできますが、通知を設定していることを確認してください:

サービスを設定するまであと少しです。

まず、エスカレーションポリシー(EP)を設定します。通常、EPは状況を適切な人にエスカレートさせ、誰かがインシデントに対応できるようにします。ここで詳しい情報を見つけることができます:https://support.pagerduty.com/docs/quick-start-guide#section-create-an-escalation-policy ホームページから、Configuration → Escalation Policies → New Escalation Policy へ移動します。 EPの名前を作成します。

次にサービスを設定します。サービスは関連情報を裏付けるために設計されています。詳細については、https://support.pagerduty.com/docs/quick-start-guide#section-create-a-serviceをご覧ください。 Configuration → Services → Add New Service の順に選択します。 きちんとした名前をつけてください。 DatadogをIntegration Typeの欄に表示させてください。 How should responders be notified(レスポンダーにどのように通知するか)というフィールドは、状況によって異なります。あなたが話題のトレンドをモニターしたいならば緊急性の低いサービスをお勧めします。一方、重大な顧客サポートに関わるインシデントを監視したい場合は、緊急性の高いサービスをお勧めします。低緊急度サービスと高緊急度サービスの違いの詳細については、https://support.pagerduty.com/docs/service-settings#section-use-case-1-critical-and-non-critical-incidentsを参照してください。

ヒント: なぜDatadog?

PagerDutyには連携する200以上のインテグレーションがあり、そのうちの1つがDatadogです。あなたのチームが他のツールを使用している場合でも、PagerDutyがそれとインテグレーションできる可能性は非常に高いです。また、インプルななREST APIを使用することもできます。

あるコンテンツがトレンドになっている時や、熱いソーシャルメディアの状況を管理する必要がある場合、適切な時に適切な人に通知するためのアラートサービスを提供しています。

ステップ4:Datadogホストを作成します。

https://app.datadoghq.com/signupで新しい試用アカウントを作成します。 指示に従って、MacまたはWindowsコンピュータにDatadog Agentを設定します。Macではターミナルでコードスニペットを実行します。Windowsではインストーラーをダウンロードして使用します。

https://app.datadoghq.com/account/settings#apiにアクセスし、APIキーをコピーします。そして設定ファイルに貼り付けます:

このクイックガイドに従って、PagerDutyのDatadogとのインテグレーションを行ってください。すでにサービスを設定しているので、次のような画面が表示されます。

アプリを実行します。アプリケーションの起動方法については、README.mdを参照してください。最初のツィートが追跡された後、この指標はDatadogに存在するはずです。 Monitors→New Monitors** の順に移動して、新しいメトリック・モニターを作成します。

メトリックに_tweet_countを選択します。 システムが動作することを確認するために、低いアラート閾値(例では5)を設定します。例えば、

分かりやすいメッセージをタイトルに追加し、説明に@pagerdutyがタグ付けされていることを確認してください。次の図を参照してください。

Saveをクリックすると、数分間であなたの電話にアラートが表示されます。 これで完全なTwitter Trend Alert Systemを持っていることになりました。

ステップ5:ブラッシュアップ

順調に機能できたので、これからはアラートを解決しましょう。

テスト設定からのアラートを避けるために、Datadogの閾値を上げましょう。Monitors→Manage Monitorsの順に移動します。メッセージタイトルのmonitorの上にマウスカーソルを置き、Editをクリックします。アラートの閾値を100,000などの大きな数値に変更します。

PagerDutyでは、通話やテキストメッセージに返信することでアラートを解決できます。あるいは、Webサイトからインシデントを解決することもできます。

次のステップ

あなたは今、完全に動作しているTwitter Trend Alert Systemを持っています。今こそ、ソーシャルメディアのトレンドを効果的に活用する時です。

PagerDutyがシステムの機能をどのように強化するかに興味がありますか?

弊社の製品を最大限に活用するための次のいいステップがあります:

エスカレーションポリシー :特定の広報インシデントには経営幹部の決定が必要です。連絡を取る時間を短縮し、エスカレーションポリシーを設定して通知を受けるようにします。 ステークホルダーユーザー:あなたの社内に重大な広報インシデントが起こったことを通知されたい人がいますか? 次は利害関係者のユーザーを設定することを検討してください。 操作コマンドコンソール (OCC):大規模なインシデントの際にTwitterで顧客がどのように反応しているかを監視します。

本記事は米国PagerDuty社のサイトで公開されているブログをそのまま日本語に翻訳したものです。原文はこちらを参照してください。

2018年5月17日  (更新日:2022年3月11日)    |    インテグレーション&ガイド

Threat Stackインテグレーションガイドを追加しました

Threat Stackは、クラウドインフラの監視ツールです。PagerDutyとThreat Stackのインテグレーションによって、お客様はThreat Stackポリシーで生成されたアラートをPagerDutyに簡単に送信して、通知をよりうまく管理し、運用ワークフローに組み込めます。Threat Stack内のアラートを解消すると、PagerDutyのインシデントも自動的に解決されます。私たちはお客様が可能な限り簡単に稼動できるようにPagerDuty Connectを提供しています。

詳しくはこちら

2018年5月15日  (更新日:2022年3月11日)    |    インテグレーション&ガイド

Pivotal Cloud Foundryインテグレーションガイドを追加しました

PivotalのCloud-Nativeプラットフォームは、世界で最も賞賛されている多くのブランドのソフトウェア革新を推進しています。世界各地のコミュニティに数百万の開発者がいる中、Pivotalテクノロジーは、何十億人ものユーザーに日常使用されています。 シリコンバレーの最も優れた企業のソフトウェア開発文化を10年以上にわたり形成した後、今日、Pivo​​talは、世界がソフトウェアを作る方法を改革するグローバルなテクノロジーの動きをリードしています。

詳しくはこちら

2018年5月11日  (更新日:2022年3月10日)    |    インテグレーション&ガイド

Icinga 2インテグレーションガイドを追加しました

IcingaはNagiosからフォークしたオープンソースのシステム、ネットワーク監視ソフトです。このガイドではPerlベースのプラグインを使用して、IcingaのインストールとPagerDutyへのインテグレーションを解説します。

詳しくはこちら

2018年5月9日  (更新日:2022年3月11日)    |    インテグレーション&ガイド

Postmanインテグレーションガイドを追加しました

Postmanは、API開発者がAPIを共有、テスト、文書化、監視するための不可欠なツールチェーンであり、世界中の300万人以上の開発者が使用しています。Postman ProとPagerDutyとのインテグレーションにより、Postman Monitorの結果でPagerDutyのインシデントと確認応答(Ack)をトリガーすることができます。

詳しくはこちら

2018年5月7日  (更新日:2022年3月9日)    |    インテグレーション&ガイド

Desk.comインテグレーションガイドを追加しました

Desk.com PagerDutyアプリケーションでは、PagerDuty内でインシデントをトリガすることができます。 これにより、数時間後でもチームに通知を送信できます。 PagerDutyシステムでは、チームのメンバーに通知する方法と時期を設定できます。

詳しくはこちら

2018年5月2日  (更新日:2022年3月11日)    |    インテグレーション&ガイド

Signalfxインテグレーションガイドを追加しました

SignalFxは、指定されたメトリックを収集、保存、視覚化、分析、アラートすることができる最新の監視プラットフォームです。 SignalFxとPagerDutyは、SignalFxの検出器によってアラートがトリガされた際、自動的にインシデントをトリガするために連携して動作します。

詳しくはこちら

2018年5月1日  (更新日:2022年3月10日)    |    インテグレーション&ガイド

JIRAクラウドエクステンションガイドを追加しました

JIRAソフトウェアは、組織内のチームコラボレーションを有効にするプロジェクト管理ツールです。 このガイドでは、PagerDutyインシデントからJIRAのイシューを作成できるように、JIRAエクステンションを設定するプロセスについて説明します。

詳しくはこちら