イラスト発注サイト「Skeb」で発生した大規模障害への対応をめぐり、IT関係者を中心に驚きが広がっている。
Skebは米Salesforce傘下が提供するクラウドサービス「Heroku」にサーバとシステムを設置していたが、何の前触れもなく利用が停止された。サイトが閲覧できなくなり、サポート窓口に問い合わせるもなしのつぶてだった。
Skebの運営会社は、影響を最小限にするため、別のクラウドサービスへの移管を決意。昼夜に及ぶ作業により一日足らずで完了させ、無事に復旧にこぎつけた――。もっとも障害で1500万円相当の機会損失となり、「Herokuのこのような対応は大変遺憾です」と表明している。
アカウント停止は青天の霹靂
Skebを運営するスケブ(東京都港区)は2022年12月24日、前日から起きていたアクセス障害の一部始終を公表した。
23日12時22分にスケブが閲覧できなくなり、5分後に障害と認定した。30分に利用者に「繋がりにくい状態が発生しております。原因を調査中です。ご迷惑をお掛けいたします」とツイッターで報告し、併せて「Heroku」の日本代理店であるセールスフォース・ジャパン(SFJ)に連絡した。障害発生時刻から、同サービスが突然利用できなくなったためだ。
SFJからはHerokuのサポート窓口に問い合わせるよう指示されるも、応答はなかった。13時4分にSFJにその旨を伝えて状況確認を依頼した。
13時14分にはHerokuの復旧時期が未定のため、利用中止を決断。別のクラウドサービスへの移管作業を始めた。
利用者にも周知を図った。14時19分にクラウドの移管とその事情を明かし、「早ければ本日中、遅くとも明日中に復旧できる見込みです」と再開時期を明示した。障害でメールマガジンも配信できなくなり、ツイッターとブログで案内した。ツイッターで「Skeb」を含むツイートや検索をした人には、障害情報が表示されるよう「プロモツイート(広告)」も出稿した。
その後の対応
15時14分には、新しいクラウドサービスにデータベースの移管が完了した。それから3時間後にSFJから連絡があるも、Herokuの担当者からは音沙汰がないと告げられた。
20時24分にクラウドサービスのステージング環境が、翌24日の早朝4時32分には本番環境の構築が無事に完了。4時55分にドメインの接続先をHerokuから新クラウドに切り替え、7時までに動作確認を終えた。13時になり、ようやくユーザーに復旧を知らせられた(完全復旧は26日午前)。
スケブでは月間約5億円の取引高があり、今回のトラブルで1500万円相当の機会損失が発生したという。「事実上今回が初めての大規模障害」と説明している。
26日昼時点でHerokuから詳しい説明はなく、「夜間も親身にご対応いただきましたセールスフォース・ジャパンのご担当者さまには感謝いたします」とするも「厚いサポートを謳うHeroku Enterpriseにも関わらず、Herokuのこのような対応は大変遺憾です」と言及している。
スケブ社の一連の対応に、IT関係者らからは「この対応スピード凄い」「決断から移行作業に至るまで何もかも早すぎる」とツイッターで驚きの声が多数寄せられている。
同社はエンジニアがどのような開発環境でも作業できるよう、すべてのシステムは「オフラインの仮想環境で動作するコンテナイメージを作成しています」と打ち明けている。これまでクラウドの移管は検討していなかったというが、コンテナイメージのおかげでスムーズに対応できたという。
そのほか、Herokuの対応を疑問視する声も少なくない。スケブ社の契約内容は不明だが、Herokuは「Standard Support」「Premium Support」「Enterprise Support」の3つのサポートプランを用意する。「Premium Support」であれば、「サポート対応時間:週7日1日24時間」「回答時間:1 営業日以内」「Urgent チケットへの SLA:1時間」「優先対応、高ティアのサポートエンジニアとの直接のやりとりあり」をうたっている。
スケブ社は今回の騒動を受け、対応したエンジニア4人にそれぞれ3万円を支給するとともに、「障害対応手当」制度を新設した。29日、30日の休業も決めた。
ユーザーには、年末年始の「リクエスト手数料」を無料にするとアナウンスしている。
(12月27日11時追記)SFJ広報は27日、以下の回答をした。 「Salesforceでは信頼が最も重要な価値観です。当社のテクノロジーのセキュリティ、パフォーマンス、可用性ほど重要なものはありません。当社は本件について認識しており、詳細な情報を入手し次第、お知らせします」
(23年1月23日追記)SFJ広報は1月23日、以下の追加回答をした。 「Salesforceでは信頼が最も重要な価値観です。カスタマーサクセスを支援するための当社テクノロジーのセキュリティ、パフォーマンス、可用性ほど重要なものはありません。本件について、 私たちは契約に基づいて行動したことを株式会社スケブに丁寧に説明させていただいております」。スケブ社も同日、「セールスフォース・ジャパンとの協議を経て、本件が完全に解決」したと発表した。