うさもふ うさもふ
2018.05.07

障害対応について社内での情報共有のススメ

障害対応について社内での情報共有のススメ

今回は、障害対応の情報を社内へ共有することについて紹介させていだたきます。

障害対応の情報を社内共有した方が良い理由

障害は、影響が大きいものから小さいものまでサービス運営していると時に起こるものです。
一時的にでもサービスを止めるようなことにならないよう事前に対策を打つべきだと考えています。
しかし、事前に対策を打っても障害が起こるもので、予期せぬバグ、急なアクセスの増加、オペレーションのミスなど様々な要因があります。

障害が起きた時は、素早く障害をクローズさせることを考えて対応すると思います。そのまま対応完了した段階で終わりにしてしまうことも多いです。
しかし、障害からの復旧後で大事なのは、対応について振り返り、同じサービスで同様の要因での障害を起こさない、他サービスでも同様の要因での障害を防ぐことになります。

そこで、障害の対応後は、障害の要因や対応内容を振り返りをまとめ、他のチームメンバーへの知識を共有しましょう。周知され意識されることで同様の障害がへるはずです。

障害対応の情報を共有するやり方

では、障害対応の情報を共有するやり方を紹介します。内容としては、難しいものではなく、ちょっとした運用ルールと共有する内容のフォーマットを決めるだけです。

大きく4つ運用ルールを決めるとよいと思います。

1.どのようの時に共有するのか
2.報告する人は誰か
3.どこまで報告するのか
4.どのような内容を報告するのか

基本的に、サービスを利用しているユーザーに影響があるものは、他チームを含めて全体に共有した方がよいです。また、報告する人は、障害対応の全容を把握している人が良いです。

内容については、シンプルなフォーマットにし簡潔に伝えられるものがよいでしょう。

・どのような障害が起こり、影響がどうだったのか
・障害の原因は何だったのか
・障害を復旧させるためにどのような対応をしたのか
・同様な障害を起こさないようにするための再発防止策の検討し、どのような対応したのか
・備考

EWMでは、Requeを利用して障害対応の情報の共有するという運用しております。

Requeを利用した障害対応情報を社内共有するやり方

EWMでも実際に利用している共有方法の流れを紹介させていだたきます。
基本的な手順としては、下記のような流れで運用しています。

管理者

・障害対応の情報共有するメンバーにて案件グループを作成
・依頼のカスタム項目を設定しフォーマットを作成

一般ユーザー

・報告者は、フォーマットをもとに依頼を作成して投稿
・報告者以外のメンバーで内容をレビュー
・レビューで内容に不備がなければ、依頼を完了

依頼フォーマット

・発生日時
・発生状況
・対応完了日時
・原因
・対応内容
・再発防止策

フォーマットについては、テンプレート機能に例文を保存しておくことで便利です。
スムーズに記入することができますのでオススメです。

カスタム項目、テンプレート機能については下記ブログ記事にて詳しく書いてあります。
・カスタム項目の使い方
・テンプレートの使い方

Requeを利用した障害対応の情報共有については、過去の履歴を確認しやすいということ、関連ファイルについても一緒に管理することができるというのがメリットに感じます。

Requeは、実際に触っていただくことで障害対応の情報共有についてイメージが伝わると思います。
30日間無料お試しいただけますので、ぜひご利用ください。