Case Study
イーサポートリンク株式会社
イーサポートリンク株式会社
リテールサポート事業部 システムインフラ部 インフラ運用課 課長 山崎圭太氏 同課 島田洋輔氏
丹精込めて作られた野菜や果物が⾷卓に並ぶまでには、⽣産者、加⼯業者、卸・仲卸、配送会社といった、たくさんの⼿が関わっている。この⽣鮮流通に関わる全ての⼈の課題を解決するために、システムと業務受託サービスでサポートしているのがイーサポートリンク株式会社だ。システムをクラウドで多数展開する同社は、増員を伴わずに迅速に監視運⽤を整えるために、インシデント管理サービスPagerDutyを採⽤した。
―この度はお忙しいところ取材を受けていただいてありがとうございます。まずイーサポートリンク様の事業内容について教えてください。
私たちは創業以来、⽣鮮流通に特化したソリューション開発とオペレーションの提供をしている会社です。
野菜や果物などの⽣鮮品の流通業界は、⽣産者、卸売業者、⼩売業者などの多くの⽅が携わり、独特の商慣習が数多く存在しています。このような業界では、合理化や効率化だけを考えて強引に標準化を進めると、現場で⼤混乱が⽣じてしまいます。私たちは⻑年の経験と知⾒から、世の中のどのシステム会社よりも⽣鮮流通特有の運⽤や商慣習を理解していると⾃負しており、⽣鮮流通特有の慣習にも対応したサービスをサプライチェーンすべてのプレイヤーに提供することで、既存のお客様のビジネス課題の解決のみならず、新規参⼊されるお客様、これまで経験のない領域まで事業を拡⼤しようとするお客様などにストレスなくビジネス変⾰できるようお⼿伝いをしております。
―PagerDutyを導⼊した経緯を教えてください。
システムの監視は運⽤に絶対に必要ですが、新規システムの構築や既存のシステムに以前と違う視点で監視をしたい場合など、従来の外部委託による監視体制では打ち合わせが必要で、柔軟さに課題がありました。特に規模の⼩さなシステムを構築したい場合には取り回しの悪さを感じていました。
―ご利⽤中または新規開発のシステムの規模や頻度はどのくらいなのでしょうか。
全くの新規で構築するシステムは数年に1件程度で、既存システムをリプレイスするというような案件だと、ここ数年は年に数件発生しています。既存システムのリプレイスでも、新規構築のシステムでも、可能なものは基本的にクラウドで構築します。構築するシステムの要件にもよりますが、システム⾃体のコストを下げたいため、あまり可用性の高くない構成で構築しなければいけないこともありますが、どのようなシステムでも監視は重要なので必ず構築の要件として考える必要があります。
取材に応じていただいた⼭崎圭太課⻑(右)と島⽥洋輔⽒。「PagerDutyのUIは分かりやすいので、本当に数クリックですぐに設定ができました」
監視の⾯では、オンプレで残っているシステムについては、弊社が決めた指標、例えばCPUの利⽤率などを⼿順に沿って外部の委託先が監視しています。利⽤率が上がったといったワーニングや異常があれば、メールで監視部隊に通知を送り、監視部隊が当⽇の当番に、昼夜問わず電話で連絡を入れてもらうようにしています。「●●時××分、クリティカルアラートを検知し、検知メッセージは*****です」といった具合です。
この通知は、気づきの点から電話がいいのですが、外部に委託している場合は監視対象を増やすためのハードルが多いため、新たに依頼することなく、かつ電話で通知を受けられないかと考えていたところ、PagerDutyの存在を知りました。
実は弊社が利⽤中のクラウドサービスの監視アラート設定画⾯に、連携可能なツールとしてPagerDutyの名がありました。調べてみたところ、監視の仕組みであることが分かりトライアルをしてみました。2017年ごろのことです。その結果、⼗分利⽤できると判断し、当時唯⼀の正規販売代理店だった御社に連絡しました。
―ありがとうございます。PagerDutyの導⼊や監視ツールとのインテグレーションについては、すぐに設定できましたか︖
ええ、早かったですね。弊社の監視ツールはGoogle Cloud Platformのネイティブのアラート機能を使っていますが、本当に数クリックで設定が終わりました。当時はまだ英⽂のドキュメントしかありませんでしたが、⾒れば分かる簡単なUIでしたので、すぐに接続できました。
―PagerDutyを導⼊したメリットについてはどうお考えですか︖
夜間は、(チャットツールの)通知やメールだけではなかなか起きられないことがあり、やはり電話が鳴り続けてくれたほうが早く気が付きます。PagerDutyでは当然、鳴り漏れはないので、想定したラインはクリアしていると思います。
イーサポートリンクのオフィスの様子
そしてPagerDutyの良いところは、オンコール中の⼈たちに電話をかける順序がスケジュールできることです。1番⽬の⼈が電話に出なければ2番⽬、3番⽬とかけていき、誰も出なければ再度最初の⼈にかけなおすことができます。誰も通知に気付かないことがなくなりますし、誰が電話に出たのかも確認できます。
それにスケジュール登録も楽になりました。監視部隊では毎⽉シフトを組んでいますが、来⽉のシフトが決まればPagerDuty上で⼊れておくだけで簡単に当番表が作れます。監視部隊から来⽉のシフト表をもらって、それをPagerDutyに登録しているのですが、前⽉と変わらないのであれば、PagerDuty上では何もしなくてもそのまま当番スケジュールを引き継げます。
意外と便利なのは、アラートを⽌めておきたい時です。例えばデータの取り込み処理で、同じデータが取り込めずに、何度も何度も電話がかかってくるような状況が起こります。外部委託の監視の仕組みでは、それを⽌めるために、「こういう条件で⽌めてくれ」という交渉をしなければいけません。PagerDutyの場合は私たちだけで⽌められます。
―素⼈考えでは、アラートを止めていいものなのかな︖と思いますが。
PagerDutyからのコールを受けているだけでも、その間は⼿が⽌まってしまいます。ですから、電話が鳴り続くような障害の時は、対応が終わるまで通知を⽌めています。逆にそこまでの状況になると誰か⼈が張り付いているはずなので(PagerDutyを⽌めても)何かあればすぐに動けるようになっています。
それに弊社の場合は、アラートごとにPagerDutyと連携をさせています。ですから、この種類のアラートなら(⼀時的に)PagerDutyとの連携を切る、ということができます。ほかのアラートが発⽣した場合は、それは通知が来ますか ら、運⽤上困るということはありません。
今後はクラウドで構築する新規システムの監視業務は積極的にPagerDutyを使おうと思っています。監視そのものは、こちらが設定したルールに則ってその通りに動いてくれるということが理想で、システムに任せたほうが間違いないと思っています。
―ありがとうございました。