Summit 2018の事例紹介トラックに登場する顧客企業について
ソリューションと顧客マーケティング担当ディレクターである私の一番の仕事は、世界中の熱心なPagerDutyの顧客全員と会うことです。 PagerDutyがどのようにしてより俊敏で、より顧客中心の、より革新的なものになったのかなどに関する彼らの話は、本当に感動的です!
そのために、 Summit 2018では、顧客がユニークで創造的な方法で組織内でPagerDutyをどう使ったかを紹介する一般向けのトラックがあります。 Summit 2018は皆のために、あなたがスタートアップや大企業、ハイテク業界や他の業界で働いていても、何かが得られることを保証します! 登場するお客様を紹介します。
American Eagle
あなたが町で見かけるキュートな服は、衣類やアクセサリーを専門とするアメリカのオムニコマース企業であるAmerican Eagle Outfitters(AEO)のものである可能性があります。 新学期からホリディシーズンまで、カレンダーのQ4はAEOの最も忙しい時間です。Matt Kundrat氏のチームは、販売チャネルをサポートするすべてのアプリケーションが週7日で24時間いつでも利用できるようにする責任があります。Mattが説明してくれるのは、AEOがワークライフバランスを維持しながらピークシーズンにどう対応しているか、ということで、そう、維持できるんです!
FanDuel
あなたがデイリーのファンタジースポーツが好きなら、FanDuelが向いています。 同社のサイトでゲームが進行中にログインすると、トーナメントに参加したり、他のコンテストに参加したりすることができます。ただし、それはWebサイトやアプリが稼働している場合だけです。 そうでないときは、FanDuelサポートチームがこれについて確実に把握します! しかし、テクニカルチームが5つのタイムゾーンに離れている場合、サポートチームは各テクニカルチームに顧客対応の問題をどうに通知したらよいでしょうか? Business Operations ManagerのLuke Kanter氏がその方法をシェアします。
Fitch Group
Fitch Groupは金融情報サービスの世界的リーダーであり、中でも著名な信用格付け機関であるFitch Ratingsはよく知られています。 そのため、迅速なイノベーションは同グループの競争上の差別化要因です。 しかし、同社は機密性の高いデータを扱うため、強力なセキュリティとのバランスを取る必要があります。 Director of IT Product Development and Head of DevOpsであるMir Ali氏は、Fitch GroupのDevSecOpsの流れについて、背景から主な学習とベストプラクティスまでを通して説明します。
Funding Circle
Funding Circleは、ピアツーピアレンディング(融資)のリーダーとして、投資家から50億ドル以上を調達して中小企業に融資しています。 これをできるだけ簡単にすることが同社の最優先事項であり、同社のエンジニアチームが革新を継続的に提供できるようにするのが、Paul Whyte氏の責務です。Funding CircleがPagerDutyを活用して、ソフトウェアの品質とパフォーマンス、ビジネスの重要な指標を真に理解しているその方法を、聞きましょう。
GE Digital
多くの人は、フィットネス-トラッカー、スマートサーモスタット、Alexaのおかげで、Internet of Things(IoT)に精通するようになりました。 しかし、産業用IoTの規模は、特に製造業や重工業にとって、さらに大きくなることが約束されています。 GE Digitalは、産業用インターネット向けのデジタルトランスフォーメーションに役立つエンジンです。Cloud Architecture and Automation LeaderのBen Hwang氏から同社のアプローチとPagerDutyが組織内でどうに使用されているかについての講演を聞きましょう。
Good Eggs
あなたが私のような人なら、スーパーマーケットに走るのと並んで待つのが嫌でしょう。Good Eggsのおかげで、これはもう不要です。 同社は、あなたの食べ物が適切な温度に保たれるように特別な冷蔵配送トラックを使用して、生鮮食料品を戸口まで届けます。 新鮮さはミッションクリティカルなので、Good Eggsはトラックの冷蔵庫が常に動作するようにする必要があります。PagerDutyはその監視を支援するために使われています。 センサー、トラック、PagerDutyの詳細については、Good EggsのAssistant Director of OperationsのTannia Hernandez氏と、Facility Manager であるJJ Mayoraの講演をお聞きください。
まさにすごいラインアップですね? これはPagerDuty Summit 2018のトラックの1つです! 今年のサミットでは3つのトラックで20回以上のセッションが行われ、いくつかの新しい思考を促す基調講演者も登壇します。 私はアジェンダや数日間のコースで共有される優れた学習方法やベストプラクティスについてとても楽しみにしています! では、 あなたも席を予約するため今すぐ登録してください!
本記事は米国PagerDuty社のサイトで公開されているものを日本語訳したものです。原文はこちらです。
ニュース&告知
LGBTQ+グループ向けのPagerDuty Summit参加プログラム
私たちは、PagerDutyのインクルーシブな企業文化を非常に誇りに思っています。 それは当初から私たちがビジネスのコアに置いている価値であり、多様なチームを持つことはより多くのイノベーションにつながることを実地で知っています。
今後のPagerDuty Summit 2018を含めて、私たちの活動がすべて同じインクルージョンの精神を背景としていることを確認したいと思います! PagerDuty Summitは、ベストプラクティスを学び、実践的なトレーニングを受け、業界のリーダーからDevOpsの未来を聞く場所です。 私たちの目標はこのサミットを、すべての人種、民族、性別、年齢、能力、宗教、性的指向、軍関係、背景を問わず、最もインクルーシブなサミットにすることです。
私たちは、今年のサミットへ技術に触れる機会があまりない人たちのための無料パスを100枚予約しました。 そうです、この2日間の全カンファレンスで、私たちのセッションやイベントにすべて無料で入れます – 無料です!
応募するには、 このフォームに必要事項を記入して提出してください (注:英文です)。
Summit Details:
2018年9月11-12日
ウェスティン セントフランシス、サンフランシスコ
応募適格**:
女性、有色の人々、能力の異なる人々、LGBTQ +、退役軍人/軍隊の兵役、予備軍を含み、これに限定されない、技術産業や技術コンファレンスに参加した経験があまりないグループのメンバー
ご自身で旅行や宿泊施設を予約できること
18歳以上
私たちの行動規範に同意できること
抽選は、資格基準を満たすこと、完全な書式を提出することで、先着順に行われます。 選ばれた人は、完全なフォームを提出してから8営業日以内に電子メールで通知されます。 ご関心をお寄せいただきありがとうございます。お会いできますように!
*無料パスはサミットのみで、PagerDuty Universityは含まれていません。
本記事は米国PagerDuty社のサイトで公開されているものを日本語訳したものです。原文はこちらです。
ニュース&告知
PagerDutyがお届けする今年夏の新機能
2018年はPagerDutyにとって極めて重要な一年でした。 過去6ヶ月間にわたり、私たちは多くのPagerDutyの新機能の開発を加速し、デジタルオペレーション管理プラットフォームとモバイルアプリケーションのさまざまなアップデートと拡張をリリースしました。
これらの機能により、各組織は、レスポンス体制の編成と継続的な開発と配信をさらに最適化できます。開発者、運用チーム、DevOpsの実践者、および管理者が、コンテキストの洞察とインタラクティブなアプリケーションを通じて、カスタマーエクスペリエンスのあらゆる側面を視覚化できるようになります。
(訳注:下記の新機能の機能名は英文が正式名称です。和文の名称はDigitalStackが仮に訳したもので、正式ではありません。)
新機能のリリース
イベントインテリジェンスのリリース
最新の製品であるイベントインテリジェンス(Event Intelligence)は、デジタルシグナルと人間の対応行動の両方を組み込み、機械と人間のテレメトリーを組み合わせて、デジタルオペレーションを最適化します。自動適応学習アルゴリズムは、ノイズを削減し、チームがイノベーションと生産性向上に容易に集中できるようにします。 統合されたイベントインテリジェンスとインシデント対応により、誰もが同じ情報に接し、問題をより迅速に解決するために必要なコンテキストが確保されます。 ルーティングとワークフローの自動化、インテリジェントなアラート相関分析、ノイズ抑制、類似インシデントの憑依、API、およびプログラマビリティが連携して、レスポンダーが必要とする正確なマシンと人間のコンテキスト情報を提供します。
イベントルール(Event Rules) 、PagerDutyのルーティングとワークフローの自動化機能は、200以上のツールから大量のイベントデータをプログラムで管理するのに役立ちます。 イベントデータ、問題の重大度、サポート時間などに基づいて、ルーティング、抑制、通知、およびその他の動作をインテリジェントに自動化できます。
インテリジェントアラートグルーピング(Intelligent Alert Grouping)により、重要なコンテキストを集中しながらノイズを削減し、適応的機械学習とルールベースのアプローチによって、複雑なシステムにわたる関連する着信アラートを自動的にグループ化して1つのインシデントすることで、トリアージをスピードアップします。
類似インシデント(Similar Incidents)は 、トリアージを改善するのに役立つように、インシデント内に過去の関連のある問題を自動的に埋め込んで表示します。過去に類似の問題を処理していたエキスパートや過去のその問題の発生頻度を把握したり、過去のインシデントから得たより迅速に問題を解決するのに役立つ修復手順を含めて、状況に応じた洞察を得ることができます。
継続的な強化
今年の年初に、モダンインシデントレスポンス(Modern Incident Response)機能をリリースしました。私たちは、顧客からのフィードバックを取り入れながら、この製品を引き続き改良し続けています。
モダンインシデントレスポンス(Modern Incident Response)機能 の更新
既にPagerDutyのレスポンスプレイ機能を使用し、複数のチームのレスポンスをモバイル化し、ワンクリックでインシデントに関するアップデートを送れるようステークホルダーを登録している方もいらっしゃると思います。今夏からはさらに レスポンスブリッジ(Response Bridge)をレスポンスプレイにつなぎ合わせて、レスポンダーがシームレスにコラボレーションできるようになりました。この機能によって問題の最下部までレスポンダーが下りていけるようになり、ビジネスの重要なサービスをすばやく元に戻せるようになります。
ライブコールルーティングの機能拡張(Live Call Routing enhancements)。 電話番号をダイヤルしてオンコール通話相手にすぐにアクセスできるほか、重要なアプリやサービスに関連付けられたオンコールスケジュールとエスカレーションポリシーでオンコールをルーティングすることができます。
あるコールが次のレスポンダーにエスカレートする前に鳴動時間をカスタマイズする
自動受付の文言をカスタマイズする
コール内容を文章に転記する
この柔軟性は、さまざまなチームの対応プロセスに対応し、チーム全体および組織全体の学習を促進します。
レスポンスのモバイル化中の全エスカレーションのインシデントタイムライン項目化。 インシデントレスポンスに携わっているのが誰かを知ることは、インシデントレスポンスを加速するうえで重要であり、適切な人材を重要な問題の解決に専念させ、他者が開発に戻れるようにします。 PagerDutyのインシデントのタイムラインは、レスポンスプレイ、カスタムインシデントアクション、チャットの会話など、豊富なインシデント関連アクティビティをキャプチャします。 現在では、レスポンスのモバイル化中に発生するすべてのエスカレーション関連アクティビティもインシデントのタイムラインに記載されており、定期的な問題や新たな問題に直面した場合に貴チームが信頼する貴重な事後検証(ポストモーティム)にその内容を簡単に含めることができます。
クリティカルインシデント関連の活動をどのようにあなたの事後検証に含めることができるかについて詳しくはここでご覧ください。
インテグレーションとAPI
PagerDuty開発プラットフォームは柔軟なAPIと拡張性ツールを提供しており、どんなチームもPagerDutyと簡単に統合して拡張することができます。 私たちはすでに280以上のビルトインのインテグレーションとエクステンションをカバーしており、さらに追加しています!
最新の PagerDuty とServiceNowの公認インテグレーションは、ITチームが重要なサービス管理およびセキュリティインシデントの問題にリアルタイムで対処するのに役立ちます。 チームは脅威を緩和し、根本原因の特定とサービス修復を加速する力を得られます。 この統合により、チームは解決までの平均時間を短縮し、デジタルでの障害がビジネスへ及ぼす影響を軽減できます。
サービス群とチームの同期
ServiceNowプラットフォーム全体にわたるリアルタイム応答
自動化されたエンタープライズワイドなモバイル化
セキュリティインシデントレスポンスの迅速化
PagerDuty + Microsoft AzureとVisual Studio Team Services(VSTS)は、もうひとつの新しいインテグレーションです。ソフトウェア開発のライフサイクル全体を通して、チームに運用上の健全性の洞察とイベントインテリジェンスを提供することに私たちも大きく期待しています。各チームは、PagerDutyとMicrosoftを使用して、アプリケーションのコーディング、所有、および管理を効率的に行うことができるため、顧客に影響を与える問題を先取りしてより高品質なアプリケーションやサービスを迅速に提供できます。 その他の利点は次のとおりです。
PagerDutyインシデントとMicrosoft Azure Metric AlertsとMicrosoft Visual Studio Team Services Work Itemsとの自動同期
新しいMicrosoft Azure Metric Alertsフォーマットのサポート
インシデントレスポンスとサービス提供の迅速化
改善されたコンテキストによる開発サイクル時間の短縮
各サービスとAzureインフラストラクチャ全体の可視性の向上
V2 webhooks。 インシデントベースのWebフックを使用すると、インシデントが発生したときに外のWebhook URLにWebhookメッセージを送信できます。 Webhook受信者は、ID、イベント、作成日時、インシデント、ウェブフック、およびログエントリなどの複数のメッセージ要素を含む、メッセージ配列のペイロードを受信できます。
あるアカウントに拡張機能を追加するためのAPI 。 APIを介してサービスに拡張機能(webhookなど)を追加できます。
モバイル
アップデート: iOSのUniversal Linksのサポート (訳注:Universal LinksはiOS 9以降で導入されています)。レスポンダーが時間を節約できれば収益とカスタマーエクスペリエンスにポジティブなインパクトを与えられるため、調和のとれたモバイルエクスペリエンスが、レスポンダーにとってとても重要です。そのため、私たちはiOSのUniversal Linksのサポートを実装しました。 iOS Safari、Mail、Messagesからタップされた、インシデント、エスカレーションポリシー、ユーザーへのリンクは、PagerDuty Appでシームレスに開けます。
モバイルアプリについて多くのご意見をいただきました。人々はどこにいてもモバイルデバイスからアクセスできて、エスカレートできるようにすることが大好きなので、次の機能を追加することでアプリをさらに便利にすることに決めました。
iOS 1Passwordインテグレーション 。
インシデントの中の詳細、メモ、電話番号とURLをクリック可能に。
インシデント優先度(Incident Priority)のサポート (詳細、インシデントリスト、ソートなどを含みます)。
インシデントタイムラインのレスポンダリクエストとメモのiOSの電話番号とURLをタップ可能に。
PagerDutyモバイルアプリでのライブアップデート対応。この詳細については、 エンジニアリングのブログをご覧ください。
これらは2018年のこれまでに用意した全アップデートです! しかし、今年はまだ終わっていませんし、後半に発表する予定も増えています。製品や機能の最新かつ最大限の情報を知るためにチューニングはそのままにブログをチェックしてください。
本記事は米国PagerDuty社のサイトで公開されているものを日本語訳したものです。原文はこちらです。
インシデント&アラート
フォースの覚醒:PagerDuty + DatadogでDevSecOps
セキュリティ専門家として長年過ごしてきた私は、Datadogのような企業が、変化するセキュリティ環境にどう対応しているかに常に関心を持っています。 昔はセキュリティ組織がセキュリティの責任を完全に負っていて、ビジネスの周縁(perimeter)を保護することに重点を置いていた、ということも思い出せます。しかし、クラウド、モバイル、Webアプリケーションの出現で、周縁は消えてしまいました。 それと並行して各企業は、セキュリティとは開発チームと運用チームの中で共に責任を担い 、統合されるべきだと認識するようになっています。
それに向き合いましょう:Webアプリケーションに対する攻撃はMenace(脅威。ファントム・メナースから)となっており、毎年急速にデータ侵害が増加しています。 Rogueアクターは、インフラ、ソフトウェア、およびプロセスの弱点を悪用しています。私たちはこれに対してどのようにしてStrikes Backしますか? New Hopeをここに…DevSecOps!
お分かりでしょうが、私は子どものころからスターウォーズの熱狂的なファンです。いつもこの話題のシリーズの新作が発表されるたびにワクワクしています。最新版は私にこの、遠く遠く離れた銀河の(原文はa galaxy far, far away )の教訓がDevSecOpsに関して私に教えてくれたことを思い出させました。
“覚えたことは全て忘れるのじゃ” – ヨーダ
賢明なJedi Masterが言ったこの言葉を言い換えると、あなたがずっと真実だと思っていた知識のいくつかは、いつか偽に変わることもある、と言っていたはずです。DevSecOpsについて言えば、それはトランスフォームの成功を邪魔することもあります。時代遅れのツールとプロセスを使うことで、セキュリティチームが物事を停滞させる可能性があるのです。セキュリティは、組織内のセキュリティのマインドセットを変える一部として調整が必要であり、より新しいツールやプロセスがどれだけ良きパートナーになるかを知っておく必要があります。クラウドアプリケーションの監視サービスであるDatadogは、ツールとプロセスを更新する必要があると認識した企業の1つです。 そのセキュリティチームは開発部隊から学び、PagerDutyをアラートとレスポンスに使用し始めました。 PagerDuty Securityチームの一員として私は、ビジネスに自前のサービスを生かすこと(Eat Your Own Dog Food)も 自分のプラットフォームをセキュリティ業務の一環として使うこともできます。 しかし、なぜでしょうか?
“こいつはケッセルまで12パーセクで飛べた船だ!”- ハン・ソロ
PagerDutyでは、私たちは即応性と応答性を備えたモデルを志向しています。 例えば、セキュリティイベントが発生していたりリソースが準拠していないことをどれぐらい早く発見できるでしょうか?あるいは起きた問題を収めるためにどうに迅速に対応できるでしょうか? といったことです。DevSecOps一部は、セキュリティについてスピード面でスケールする自動化された決定をすることです。 ミレニアム・ファルコンが光速で飛ぶほどは速くないかもしれませんが、迅速に対応できることは、潜在的なコスト削減とリスクの削減につながります。 スピードが要(かなめ)なんです!
すべてのリリースが100%安全で、100%稼働率を達成していると言えればよいのですが、現実にはありえません。現実では問題が起こり、どのくらい迅速に対応できるかが収益に影響します。 2017 Ponemon Cost of Data Breach Study は、インシデントレスポンスチームを組織することで、レコードあたり最高19ドル分の損失を削減できることを示しました。 適切な人にアラートして迅速に関与させることが重要です。
PagerDutyでは、クラウド内でマルチテナントのSaaS(software-as-a-service)プラットフォームを運用し、さまざまなツールを使用してインフラストラクチャを監視および保護しています。 これらのツールは、私たちが採掘してフィルタリングできる多くのシグナルを生み、PagerDutyプラットフォームとのインテグレーションにより、関連するセキュリティイベントとアラートをまとめることができます。 これにより、イベントに即応して、 インシデント対応プロセスを開始し、迅速に対処と復旧ができるようになります。
これはセキュリティインシデントに限りません。 開発者がコードを所有している環境では、クラウドインフラ内のリソースがコンプライアンスから逸脱したり、セキュリティリスクが発生したりする事態を迅速に判断することもできます。 迅速に対応して開発者と協力して問題を修正し、最善のセキュリティプラクティスについての早急なフィードバックを提供し、以後のプロセスを改善することができます。
“やるか、やらないかじゃ。試しはない ” – ヨーダ
DevSecOpsのアプローチを実装するのは、難しい作業のように思えるかもしれません。また成功するためには、組織内のセキュリティの考え方を変えるなど、多くの課題があります。 それ自体は、ジェダイの精神的なトリックを使うべきだと思えるかもしれません。しかし、あなたはプロセスにコミットし、その後に自分の間違いから学び、また過去に同じことをした他の人から学ぶ必要があります。DevOpsと同様に、DevSecOpsは反復学習と改善のプロセスでなければなりません。 DevSecOpsは、迅速なフィードバックを提供するためにセキュリティプロセスを自動化するための適切なツールを選択することでもあります。PagerDutyを活用すれば、そのトランスフォーメーションを助けられると思います。
あなたの組織でDevSecOpsをうまく実装する方法の詳細を知りたいですか? Datadogの導入事例をチェックしてください。
本記事は米国PagerDuty社のサイトで公開されているものを日本語訳したものです。原文はこちらです。
DevOps
ノイズを減らすPagerDutyのイベントインテリジェンス機能
私たちがお手伝いしているあらゆる業界と運用モデルで、お客様から、データの海の中から行動に結び付けられるシグナルを見つけるのに苦労しているとよく言われます。 システムとサービスチームは毎年より複雑化し続けていますが、従業員数は同じ速度で増えたり減ったりすることはありません。
これは、テレメトリー(遠隔診断)を実施する組織の量が、もはや既存の方法では管理できなくなったことを意味します。多くの企業は、1日に数千、場合によっては数百万のイベントを処理します。 重大インシデントが発生した場合、レスポンダーは重複したアラートを飛ばすのを防ぐために電話を切る必要があると各組織からよく聞かれます。 これは迷惑で気の毒なことです。特に利害が極端に高い場合は悪化し、実際の問題をすばやく特定することも不可能になります。 また、ビジネスにとっては、解決に時間がかかり、リスクも増大します。
イベント管理からイベントインテリジェンスまで
ノイズを減らすことは、常にPagerDutyの使命の一部となっていて、当社のプラットフォームは、オンコールスケジューリングやエスカレーションを自動化する効果的なコラボレーションとインシデント対応を支援し、サービスを介してこれを達成した報告と洞察力、すべて自分の運命を所有するチームに権限を与える方法で解決できました。
しかし、我々は現在、全ツールとインフラからのシグナルの急増を処理できるスーパーパワーを各チームに与えられるように、新しい製品に注力しています。
イベントインテリジェンスは、すべてのツールからのシグナルを収集し、ノイズを抑制し、実行可能なアラートを相関させ、レスポンダーにその情報を取得させるなど、イベント管理の世界で共通なたくさんの問題に取り組んでいます。 しかし、それはシステムと人間のデータを融合させてノイズを減らし、反応を集中させ、チームに力を与えることによって、新しいユニークな方法で解決を図ります。
インテリジェントアラートグルーピングは簡単な洞察から生まれました。システムからのリッチなデータでできることはたくさんありますが、レスポンダーがデータを処理することも(もしかしたら他のことより)重要です。 インフラがスケールし更新され、チームは予測しなかったやり方でユーザーと対話する新しいサービスを開始するので、従来のコマンドと制御のアプローチでは追いつけません。
しかし、チーム上のユーザーがオペレーション上の問題をどうにやり取りし、その行動から時間をかけて学習するかを知ることで、当社のサービスは、あなたのシステムが成長して変化しても、アラートを効果的に相関させ、ノイズをカットして時間とコストを大幅に節約し、より高いレベル・よりインパクトのある作業にフォーカスできるようにします。
“使えます” –Andrew Percher, Macy’s (訳注:イベントインテリジェンスについての感想)_
アラートがアクション可能なインシデントに関連付けられれば次はレスポンスです。 Similar Incidents機能は、現在のインシデントに関連するインシデント群に対するこれまでのあるアカウントのレスポンス履歴を調べ、データサイエンスを駆使してレスポンダーの指先に正確なコンテキストを届けます。 レスポンダーは、インシデントが日常的に起こっているのか・隠れていた危険なものであるのかを簡単に知ることができ、過去のインシデントのメモやその他のトリアージを助けるメタデータを見られます。 レスポンダーは、集約して表示された過去の運用上の問題のパターンを確認することで、より自信を持ち、より効果的に動けるようになり、最も重要なときに貴重な時間を節約できます。
“Similar incidents の機能は、チームに追加でレスポンダーを配属したようなものです。”-Corey Burke、Dialpad___
その裏で、 Advanced Event Automationはシグナルのフィルタリング、強化、優先順位付けを行い、人々に不必要なアラートを行わないようにします。また、通過するシグナルには 、runbooksや回復のための情報などのすべての適切なコンテキストが含まれます。
我々は昨年のPagerDuty Summitでこれらの機能の多くを紹介し、何百もの早期アクセス顧客から大きなフィードバックを受けました。 彼らは、イベントインテリジェンスが手作業によるトリアージプロセスに取って代わり、レスポンダーの生活の質を向上させ、構成とメンテナンスにかかっていた数え切れない時間を省いたと語っています。 また、これらの機能を使った顧客を調査したところ、シグナルがフィルタリングされ、抑止され、インテリジェントに相関されるため、全体の98%のノイズが削減されています。
今すぐ試してみてください
イベントインテリジェンスをすべてのお客様に提供できます。 まず、PagerDutyの担当者に連絡するか、無料トライアルにサインアップしてください。
本記事は米国PagerDuty社のサイトで公開されているものを日本語訳したものです。原文はこちらです。
ニュース&告知
Signal Sciencesインテグレーションガイドを追加しました
Signal Sciencesは、SaaSによるWebアプリケーション防御ソリューションで、トラフィックを邪魔することなく、攻撃者がターゲットとするアプリの防御の優先順位を決めることができます。Signal Sciencesでは、提供するサービスキーを認証するアカウントにページを送信することで、PagerDutyインシデントをトリガーすることができます。
詳しくはこちら
インテグレーション&ガイド
Opsmaticインテグレーションガイドを追加しました
Opsmaticは自動ドリフト検出による構成監視と、ホストの状態比較をするツール、活動を視覚化するためのツールを提供します。Opsmaticを使うと、チーム全体の視認性が向上し、問題をより迅速に解決することができます。PagerDutyを設定して、Opsmaticフィードとタイムラインビューに、通知、Ack、解決アラートをプッシュできます。 さらに、失敗したポリシーチェック、保存された検索結果を基に自動的にインシデントを作ったり、あるいはキーイベントをトリガーとして手動でPagerDutyでインシデントを作るよう設定することもできます。
詳しくはこちら
成長の機会を与えてくれたPagerDutyでのインターンシップ
私の名前はJoshua Carnide、Waterloo大学でソフトウェアエンジニアリングを学ぶ4年生です。この記事で、私がPagerDutyのトロント事務所でのインターンシップで得た素晴らしい経験と、それが成功のためにどうに役立ったかをお伝えしたいと思います。
私はPagerDutyのAndroidとiOSアプリケーションの維持と改善を担当するモバイルチームのメンバーでした。このチームの目的は、移動中にユーザーがPagerDutyプラットフォームとシームレスにやり取りできる機能を提供することです。小さなチームだったけど急速に成長していたチームでした。2018年1月に参加したとき、このチームにはわずか5人しかいませんでした。 3ヵ月後、2人のエンジニアリングインターン(私を含む)、製品管理のインターン、5人の常勤デベロッパー、アジャイルコーチ、製品オーナー、エンジニアリングマネージャーの計11人に増えました。 私はここでの4カ月間に想像していた以上に多くのことを学び、信じられない才能を持つ多くの人と出会い、エンジニアとして大きく成長できました。
PagerDutyの人々:多様性と包括性
PagerDutyの人々は驚くべき人ばかりでした。 彼ら自分の製品と彼らが行う仕事について心からの情熱を持っています。ユーザーに最高の経験をしっかりと提供し続けて、その合間に楽しい時間を過ごすために働いています。
PagerDutyは、多様性と包括性を強く信じる個人のコミュニティでもあります。他者との違いを受け入れる環境であり、あなたが本来のあなた自身であることができる場所です。例えばInternational Women’s Dayの日、同社のトロントオフィスでは、SalesforceやProcter&Gambleなどの4人の地元の女性のプロフェッショナルを招いたディスカッションパネルを開催しました。私にとって他のジェンダー指向と比較した女性のキャリアパスについて深く知ることができ、さまざまな職業の女性が直面している現代の課題を知ることができる貴重な機会でした。
PagerDutyにいた時、私はインターンだと思ったことはありません。いつもフルタイムの従業員の一人のように感じました。 インターンシップの最初の1週間に、カリフォルニア州ナパバレーで開催された会社のキックオフ( Company Kick Off :CKO)イベントに参加する特権を得ました! CKOは、シドニー、ロンドン、シアトル、トロント、サンフランシスコのオフィスなど遠隔地の従業員が一緒に来て、PagerDutyの成功を祝い、新年に向けての重要な優先事項に認識を合わせる機会でした。このイベントには多くのソーシャルな機能があり、さまざまなチームや世界各地の人々と出会う機会がありました。サンフランシスコのオフィスで働いているモバイルチームのメンバーにも会いました。会社のさまざまな従業員の背景や経験について学ぶことは本当にクールでした。PagerDutyの一人ひとりがユニークで特別なものをその場に持ち寄っていたのです。
CKOの中のあるソーシャルイベントに参加したモバイルチームと私。 (私は左の後ろの列にいます。)
メンターシップ
インターンシップの初めのうち私は人に助けを求めることを躊躇しました。他の開発者を邪魔(bugging)したくなかったからです。しかし、そのうちにすぐ、彼らが人を助けるのが大好きで助けを求められるのも大歓迎なんだということに気づきました。そして問題を解決するためにペアリングすることがどれほど有益であるかも分かりました。
以前のインターンシップでは、私はAndroidの開発だけを行っていました。 だから私が初めてiOSのタスクを割り当てられたときには、iOSアプリケーションで作業したことがなかったし、Swiftプログラミング言語の経験がないので、随分緊張しました。 タスクはモバイルアプリのライブアップデートに関連するものでした。リアルタイムでコンテンツを動的に更新する新しいアプリの機能です。 この機能の基盤はすでにアプリに入っていて、あまりにも多くのコードを必要ではなかったし、かなり簡単な作業でしたが、どこから始めるべきかはわかりませんでした。
私が助けを求めたときに受けたサポートには驚きました。私はチームのフルタイムの上級iOSエンジニアとペアを組んで一緒にソリューションを作りました。途中で、Swiftの複雑さとiOSフレームワークの基本についても立ち止まり議論しました。その中でPagerDutyアプリについてのベストプラクティスと共通のパラダイムとデザインの決定などの話もしました、
加えて、私は途中で多くの有益な指導をいただきました。私たちのモバイルアプリケーションは、学習曲線が急に上を向く強力なライブラリやテクノロジーを利用しています。それでも私のチームメンバーは、私に手を差し伸べるためには喜んで自分の手を止めてくれました。 時間がをかけてなぜ何かがそのようになったかという理由を説明してくれましたし、何かを改善したり最適化したりできるかどうかを議論することには常にオープンでした。
さらに、私はインターンだったので、何をどうすべきかを決定する際に主導権を持つ(”call the shot”な)ポジションにあるとは思っていなかったのですが、間違いでした。 1か月以上経った後、私はフルタイムのAndroidエンジニアと共同で、テストのしやすさとスケーラビリティを向上させるためにAndroidアプリケーションをどう再構築すべきかという提案書を作りました。チームとして、私たちはどのアーキテクチャを使うかを決めましたが、私たちのアプリケーションにどう適用するのかは決まっていませんでした。 私は私たちのアプリにアーキテクチャを統合する方法の技術的な詳細を書き上げる責任がありました。それは重い責任でしたが、そのチャレンジを進んで引き受けました。他の開発者からの徹底的な見直しを受けてから、この提案は最終的に承認され、現在は私たちのアプリの標準として機能しています。
提案を完全に実行するプロセスには長い時間がかかります。 しかし、我々は、新しいアーキテクチャの基礎とそれで実装されるすべての新機能を定めました。 PagerDutyのAndroidアプリの未来に革命を起こすために私が大きな役割を果たしたと分かるのは素晴らしいことです。
小さなチームで大きなインパクトを
相対的に言えば、モバイルチームはPagerDutyの他のチームと比較してまだ小さいです。 小規模なチームとしては自律的にやれることがたくさんありました。たとえば、私たちのアプリで使用すべきコードアーキテクチャーに至るまで、プルリクエストの形式のような単純なものを理解することは、私たちの責任でした。 私たちは、アプリケーションのリリース時期や頻度を自分たちで決めました。チームはこのプロセスを非常に大事にしています。まずPagerDutyの従業員に新しいバージョンのアプリケーションを配布して、そののちに最高品質のアプリがユーザーに提供されるようにします。 チームの上級エンジニアと数回ペアを組んで、モバイルアプリをユーザーにリリースしました。 この経験から、多数のユーザーにアプリを出荷するプロセスについての洞察が得られました。すべてを円滑に進めるためにリリースを監視する方法を学びました。
成長の機会
PagerDutyには、パイプラインにたくさんのクールなプロジェクトがあり、どれもオフリミットはありません。 私が最初にPagerDutyに入社したとき、私はiOS開発やバックエンド開発をしたいという希望を出しました。 私は両方の仕事をする機会を与えられただけでなく、すぐにユーザーに出荷される重要なプロジェクトに取り組ませていただきました。
新しいことを学べたもう1つの非常に便利な機会は、モバイル・チームの週1回の共同作業セッションでした。そこではチームメンバーが個人的な開発にとって価値のあるものに取り組みます。 何か新しいことを探求し、疑問があるときはいつでもチームの上級開発者のサポートを受けるのは本当に便利なチャンスでした。私はこの時間を使って技術的知識を広げました。Swiftについてより深く学び、さらにiOSフレームワークについて学ぶために小さなiOSアプリケーションを開発しました。
私はアジャイル手法についても学びました。これは私のワークフローを実際に改善しました。 モバイルチームに参加したとき、彼らはScrum Agileメソドロジーを採用していました。 基本的に、これは、チームがスプリントと呼ばれる固定された時間単位で作業を完了するよう計画することを意味しました。私たちのチームにとっては、各スプリントは2週間の長さでした。 各スプリントの終わりに、私たちのチームは一緒になって( れとろすぺくてぃと呼びます)スプリントについて議論しました。何がうまくいったのか、あまりうまくいかなかったのか、プロセスを改善するためにどんな行動が可能だったかを議論したのです。
これらの実践の中で、ボトルネックを特定して修正する方法と、他の開発者と効果的に連携する方法を学習しました。私が最初に会社に入社した時と比べると、自分が高品質の仕事を完成させようとしている間にスループットが大幅に増加したことにはっきりと気づきました。 もう一つのことも気が付きました。つまりPagerDutyが真剣に取り組んでいることは、皆の意見が重要であることと、レトロスペクティブは、各チームメンバーがチーム全体としてどのように改善でき、皆の提案が考慮されたかにというフィードバックを提供する機会であったことです。
未来に
全体的に見て私のPagerDutyでのインターンは最高の経験でした。 インターンシップが終わり、学校に戻ることは辛かったです。幸運にも多くの素晴らしい人と出会って、これからも続くたくさんの関係を築けたと感じています。 私は、自分がインターンシップの過程で獲得したスキルセットが、将来のエンジニアリングの取り組みに役立つと確信しています。 PagerDutyとモバイルチームと過ごした期間は、私にとって決して忘れられない経験です。
PagerDutyで働くことに興味がある場合は、キャリアページ(訳注:米国PagerDutyサイトの応募ページにリンクしてあります)に応募することを検討してください 。
本記事は米国PagerDuty社のサイトで公開されているものを日本語訳したものです。原文はこちらです。
Neustarインテグレーションガイドを追加しました
Neustar Web Performance Management は、WebサイトとWebアプリケーションのパフォーマンスをテスト、監視、測定します。オンコール・スタッフのローテーションのスケジュール作成や、モバイル端末から即座にもWebサイトの障害対応をすることができるような機能を追加するために、NeustarはPagerDutyと連携して、PagerDutyのオンコール・スケジューリング、アラート、インシデント追跡のソリューションを「PagerDuty Connect」を介して統合できるようにしました。
詳しくはこちら
LogDNAインテグレーションガイドを追加しました
LogDNA は、ログを監視し、ライブログを表示し、問題を可能な限り早期に特定するのに役立つ、異常検出ツールです。
詳しくはこちら
OverOps統合ガイドを追加しました。
OverOpsを使用すると、開発中にコードブレークがいつ、なぜ発生したのかを知ることができます。プロダクションJVMでの、完全なアプリケーションコールスタック、ソースコード、キャッチ/キャッチされなかった例外、ログに記録されたエラーやワーニングを参照できます。
詳しくはこちら
Honeybadgerインテグレーションガイドを追加致しました
Honeybadgerは、Ruby on Railsアプリケーションのエラー管理スイートです。 アプリケーションからエラーデータを収集し、ユーザーフレンドリーな形式で表示することで、問題をより迅速かつ容易に追跡し解決します。 HoneybadgerとPagerDutyを組み合わせることで、アラートによってこれらのエラーに関する情報をチームに配信し、記録的な速さで問題を修正できます。
詳しくはこちら
Pulsewayインテグレーションガイドを追加致しました
Pulseway(以前のPC Monitor)は、スマートフォン、タブレット、Windowsベースの監視ソリューションです。 これは、ダッシュボードから完全な透明性と完全なコントロールを提供することを強調しています。非常に高い顧客満足度を誇り、管理ニーズに合わせて複数のプラットフォームを有効にすることに集中しています。
詳しくはこちら
Crashlyticsインテグレーションガイドを追加しました
Crashlyticsは軽量ながら非常に強力なクラッシュレポートソリューションです。 CrashlyticsとPagerDutyをインテグレーションすることで、アプリケーションのクラッシュレポートに関するリアルタイムのアラートを受け取ることができます。
詳しくはこちら
PagerDuty + Atlassian:モダンインシデント対応を前進させる新しいエクステンション
「常時稼働・即時対応」の顧客の要求と期待の高まりに応えるため、デジタルオペレーションは人々の仕事の仕方を変えつつあります。 また、最も興味深いマクロなトレンドの1つは、IT運用チームと開発チームだけでなく、ビジネス全体がどのように顧客への対応力をレベルアップさせるよう注力しているかを見ています。 良いにつけ悪いにつけインシデント対応は、時間の制約のある中での組織全体の取り組み(カスタマーサポート、エグゼクティブ、コミュニケーション/マーケティング、セールスなどを含む)で効果的な対応を策定するための非常に良い例になります。重大インシデントはビジネス上の問題であり、製品上の問題ではありません。 現代のインシデント対応には、優れたコミュニケーションとコラボレーションが不可欠です。
Atlassianはこの現実解を与えてくれます。 当社が既に用意しているJIRA、HipChat、およびStatusPageとの深い統合に加えて、 PagerDutyのStride向けエクステンションの一般向けの提供開始をここに発表します。 Strideは完全なチームコミュニケーションソリューションで、何かPagerDutyでのインシデントが発生したときにチーム全体の可視性を向上させるのに最適です。 しかし、最も重要なことは、Strideが、重大インシデントのような危機の時に組織を調整するのに役立つということです。 特に、効果的なインシデント対応を推進するために、Incident Commanders、Deputies、Scribesの優れた機能を提供します。 (Incident Commandに精通していない場合は、 https://response.pagerduty.com/を参照してください )。
Incident CommandのStride機能をご紹介します。
PagerDutyのStrideサイドバーの使い方
PagerDutyはChatOps(GitHubの商標です)の初めに関連していることを誇りに思っていますが、ChatOpsの悪い応用例の1つは、対応中のインシデントの詳細を理解させるために新しいレスポンダーにチャットログ全体を読み上げるよう強制することです。それに対してStrideのサイドバーは、インシデントに関して関連性が一番高い情報のスナップショットを提示しておく場を提供します。インシデントに関連する冗長な会話はルームで行われ、一方でサイドバーのアクティブなインシデントの表示には、インパクト、イベント、重要な決定事項、および実行されたアクションの要約が含まれます。
このタイプの情報はまさにScribeがキャプチャし続ける必要があるものであり、リアルタイムでキャッチアップするためにも、後でタイムラインを編集するためにも最適です。 共通の基礎情報はコミュニケーションの重要な概念であり、インシデント対応にとって特に重要です。インシデント・コマンダーは、共通の基礎情報を維持するために、これらの種類の要約を定期的に(音声でのコールでは口頭で)行うように訓練されています。 スピードを上げるために人々に「チャットログを読め」と強制しないでください! (興味があれば、ExomiteのDan Slimmon氏はVelocity Santa Clara 2016で素晴らしい話をしています。ご覧ください。)
Stride Decisions
効果的なインシデント対応の重要な原則の1つは、すべての意思決定権限がインシデント・コマンダーに与えられることです。 これは、リスクの高い決定が顧客の影響を緩和するために必須な重大インシデントでは特に重要です。 トレーニングで使用する1つの例を示しましょう。ダウンタイムが発生すると同時に全Webサーバーを再起動するのは一般的ではありませんが、既に他の方法ですべての顧客が影響を受けている場合は、再起動が正しい選択かもしれません。
Stride Desicionsは、そのハード・ディシジョンをレスポンスが記述されているときにインラインで簡単に記録できます。 この種の意思決定ポイントの記載は、あなたの対応チームの共通の基礎情報を更新する素晴らしい方法です。 ただ覚えておいてください:あなたは決定を下す権限を持っていますが、あなたは常にあなたの Subject Matter Experts(SMEs)の専門知識を活用すべきです。 あなたは自分の意思決定について承認する必要はありませんが、実行する前に「何か強い反対意見」を求めておくのは、事後の偏った見方を防ぐために常に良い考え方です。
Stride Action
インシデントコマンドが有効な間に、統制のとれた状態を保つのが難しいことがあります。 決定が下されると、いろいろな行動がしばしば続きます。Stride Actionsは、さまざまな調査や実験を追跡し、それによって幅広い顧客への影響を理解し、それが顕在化するまえに緩和する方法を知るために最適です。
この種の機敏を要するアクションについては、次の3つを強く推奨します。
Assign them(担当に割り当てる)、つまり個人名( “Dave Cliffe”)または機能( “Network on-call”)で指定すること。 Time-box them(締め切りを示す)、担当者はより多くの情報を得る余裕がどのくらいあるかを知ることができます(これは緊急性を意識させるためにも役立ちます)。 Receive acknowledgement (誰かが受任したという通知を受け取る)、インシデント・コマンダーは彼らがタスクを理解していることを知っています。
事後検証をないがしろにしないこと
混乱が収まり、顧客への影響が少なくなったとき、インシデント・コマンダーがすべき最後の1つは、事後検証をさせることです。 すべてのインシデントは、学習の機会であることを覚えておいてください。 システムの技術的側面だけでなく、チームのコミュニケーションの仕方を理解することで、今後の対応がさらにうまくいくようになります。だからインシデント対応プロセスを定期的に確認してください。 PagerDutyとJIRAの統合は、レスポンスチームが特定したアクション項目をフォローアップするための素晴らしい方法を提供します。
モダンなインシデント対応には、反復と学習を通じて向上する正確で自動化された共同のレスポンスを可能にしながら、分散型のオーナーシップを取り入れる新しいアプローチが必要です。 PagerDuty StrideエクステンションをJIRAとStatusPageの統合と連携させることで、PagerDutyとAtlassianは効果的なオペレーションのための優れたプラットフォームを提供します。 ぜひ試してみて、あなたの考えをお聞かせください!
その他のリソース:
Strideスタートガイド モダンインシデント対応トレーニング インシデント対応のベストプラクティス
本記事は米国PagerDuty社のサイトで公開されているものを日本語訳したものです。原文はこちらです
Opsviewインテグレーションガイドを追加しました
Opsviewは監視システムNagiosのフォークです。PagerDutyとのインテグレーションはNagiosとの場合とよく似ています。PagerDutyをNagiosとインテグレーションすることで、Nagiosのアラートを問題解決に適した担当者に直接通知することができます。
詳しくはこちら
Panopta統合ガイドを追加しました
Panoptaは、ITインフラストラクチャの要件に関係なく、お客様に合わせて拡張できるSaaSベースの監視ソリューションです。グローバルに分散した監視ネットワークから、業界最高の精度を誇るWebサイトの稼働時間とパフォーマンスの監視と共に稼働します。ローカルサーバのリソースを測定するエージェントをインストールすることでより深い洞察を得ることができます。プライベートインフラストラクチャがセキュアなファイアウォールの背後に置かれていても、仮想アプライアンスでファイアウォールの裏側の監視を行うこともできます。
詳しくはこちら
Logseneインテグレーションガイドを追加しました
Logate by Sematext はエンタープライズクラスのログ管理ソリューションです。 Logseneは、Fluentd、Logstash、Syslogなどの幅広いログ収集ツールからログを受信でき、Java、Scala、Go、Node.js、Ruby、Pythonなどのプログラミング言語用の多くのロギングフレームワークをサポートしています。 また、LogseneはElasticsearchのAPIを使いKibanaと連携し、アラートや異常の検出機能を内蔵しています。クラウド(SaaS)とオンプレミスの両方で利用可能です。また、 SPM Performance Monitoringと統合して、メトリック、イベント、ログを相関させます
詳しくはこちら