俺の話を聞け!!LT大会 #8でトークした資料です
こんにちは、アプリケーションエンジニアのid:shiba_yu36です。今日は社内で数年ほど取り組んでいる障害情報の社内共有についてご紹介したいと思います。 障害情報を社内共有する理由 サービスを運営しているなら、出来る限りサービスが一時的に止まってしまうなどの障害を起こさないように事前に対策を取るなど気をつけるべきです。しかし、どれだけ事前に対策をとっても、急激なアクセスの増加や、意図しないバグの混入、オペレーションのミスなどを理由として、障害を起こしてしまうことがあります。 障害が起きた時、それに暫定的に対応して終わりとしてしまうことも多いです。しかし、復旧した後大事なのは、障害に対して適切に振り返りをし、同じサービスで同様の理由で障害を起こさない、また社内で同様の理由の障害を未然に防ぐことです。 そこで、はてなでは障害の暫定対応をした後は、障害の振り返りや他チームへの知識共有のために
社内で不定期の勉強会があり、入社初日か2日目あたりにたまたまその勉強会が行われておりました。おーこれはいい雰囲気だ、というわけで次回はお話させてもらおうと早速手を上げました。MF Geeks Nightというエンジニア主導の会です。 てなわけで自己紹介がてら、個人でのWebサービスの開発〜運用をどうやっているかというお話をさせて頂きました。YAPC::Asia Tokyo 2014 前夜祭での発表資料を加筆修正した版です。 MF GeeksNight pplogの話 from Naoto Koshikawa MF GeeksNight pplogの話 新たな場では、まずは自分からオープンにしていくことを心がけています。こうしたとき、pplogにまつわる何かは良い自己紹介となりますねえ。ありがとう。 そしてエンジニアそういう、自分の興味のあることをシェア出来るエンジニア主導の勉強会の場を提供
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く