読者です 読者をやめる 読者になる 読者になる

http://jp.techcrunch.com/archives/20090901why-gmail-failed-today/

太平洋時間の午後0時半ごろ、数台のリクエストルータが過負荷になり、システムのほかの部分に対して”今とても遅くなってるから、しばらくこっちへトラフィックを送るな”と信号した。それによって負荷がほかのリクエストルータに送られるようになり、今度はそれらの一部が過負荷になった。そうやって、数分後にはほとんどすべてのリクエストルータが過負荷になった。リクエストがGmailのサーバにルーティングされなくなったので、ユーザはWebからGmailを使えなくなった。IMAP/POPによるアクセスとメールの処理は、Webからのリクエストを扱うのとは別のリクエストルータを使っているので、正常に動作を続けた。

gaeで7月くらい(?)に起こった障害もこういうのが原因なんだろうか。

googleのえらいひとでも扱いきれない障害系があるとすると、やっぱりSIではリスクが高すぎるのだろうか。

(英語のほうはちゃんと読んでないけど)和訳された文章を見る限りでは原因は完全にわかっているような印象でもあり、遅かれ早かれこういう障害はなくなるのかもしれないけど、gmailみたいにそこそこ実績があるサービスでこういうことがあると二の足を踏んでしまう印象。


・・・可用性もサービスレベルの一部に過ぎないし、セキュリティとか、ほかのところの懸念のほうがクリアにするのは難しいけど。