本文へスキップします。

運用・窓口保守・運用条件

KDDI GPU Cloudの運用監視

  • KDDI GPU Cloudでは、サービスが安定して正常稼働し続けるよう、リアルタイムでの運用監視環境を提供しています。
  • 具体的には、ログ情報、メトリクス、SNMPアラートなどをリアルタイムに可視化し、KDDIの運用監視担当者が「KDDI GPU Cloud」およびネットワークの状態を常時監視します。
  • これらの情報は蓄積され、過去の状態も振り返って確認可能です。また、停電や温度異常などの緊急事態が発生した際には、停電対応機能が自動で作動し、安全にシステムを停止できる仕組みを備えています。

保守・運用条件

項目 対応内容
お問い合わせ

受付時間:24時間365日
対応時間:営業時間内 (土日・祝日・年末年始を除く09:00(JST)-17:00(JST))

故障復旧対応 受付・対応時間:24時間365日
システムメンテナンス 毎週火曜日21:00(JST)~翌07:00(JST)

故障発生の通知

  • サービス設備の故障を起因に、お客さまサーバーに停止状態が発生したことを弊社が認知した場合、お申込情報でいただいた連絡先にメールでご連絡いたします。
  • お客さまによる意図的なサーバーの停止はご連絡対象外となります。また、ハードウェアの故障を弊社が認知した場合、お申込情報でいただいた連絡先にメールでご連絡いたします。
  • 状況によっては、弊社が認知する前に、お客さま側よりお問い合わせいただく場合がございますが、ご了承ください。サーバー以外のサービス稼働状況は、本サイトの障害情報へ掲載いたします。
  • ネットワーク機器など、冗長設備の片系故障による切替については、「KDDI GPU Cloud」サービス基準において故障とみなさないため、通知を行いません。片系故障による切替に伴う問題をお客さま側で認知された場合、弊社宛てにお問い合わせいただいた時点からの対応となります。

計画作業(システムメンテナンス)

計画作業において、お客さまサーバー稼働停止が発生する場合、お申込時に頂いた連絡先に事前にご連絡いたします。通信断が発生するメンテナンスやコントロールパネルのメンテナンスについては本サイトのお知らせに掲載いたします。

およそ1カ月前までにご連絡いたします。緊急性のある作業については、その限りではございません。
ご案内した計画作業日時の変更はできかねますのでご了承ください。


コントロールパネルについて

コントロールパネルのIDの記載のある開通案内を紛失された場合、再発行はできかねますのでお客さまご自身で保管・管理をお願いいたします。コントロールパネルのパスワードを紛失した場合は、初期化作業依頼が必要となります。

インシデント管理について

KDDI GPU Cloudインフラストラクチャのインシデント(KDDI GPU Cloudの設備などの故障・トラブル、セキュリティの脆弱性・事件・事故など)が検出および報告された際に取る行動について、ご説明いたします。KDDI GPU Cloudの運営管理の方針やルールなどは、KDDI GPU Cloud運営管理要領として定め、その要領に則った開発を行っています。KDDI GPU Cloudのお客さまサポート範囲(オペレーティングシステム、ソフトウェア、アプリケーション、およびデータの所有権と制御など)はお客さまが保持しているため、コンテンツ (データ) の管理および文書化はお客さまの責任範囲となります。

  1. インシデント発生・対応開始
    障害などのイベントを検出することにより、インシデントが開始されます。イベントの発生元は以下のとおりです。

    a. KDDI GPU Cloudではシステムおよびネットワークの状態を24時間365日常に監視しており、ほとんどの問題は即時にアラーム検出されます。大部分のインシデントは、この方法です。
    b. お客さまからKDDI GPU Cloudサポート窓口(24時間365日)への問い合わせ。
    c. KDDI GPU Cloudの担当者によって入力される問題チケット。

    KDDI GPU Cloudは、お客さまご利用サーバーその他に故障状態が発生した事を弊社が認知した際、またはお客さま固有の重大なセキュリティインシデントが発生した際に、お申込情報でいただいた連絡先にメールでご連絡します。
    サーバー停止以外のサービス稼働状況や障害情報、本サービス利用者全体に関係するセキュリティインシデントは、本サイトのお知らせへ掲載します。

  2. 復旧
    KDDI GPU Cloudの管理者によって対応者が割り当てられ、不具合の原因究明および修正を実施します。不具合の修正が完了した後は、再発防止策など次のステップを割り当て、対応を終了します。

  3. 再発防止
    KDDI GPU Cloudの管理者によりインシデントの事後検討と詳細な根本原因の分析について、関係するチームに割り当てられます。登録されたインシデントは、ステータスが更新されるたびに管理者に通知され、インシデント完了まで監視されます。

    注)KDDI GPU Cloudはお客さまのサーバーやその他リソース内のプライベート情報にアクセスすることはできません。
    そのため、アプリケーションアカウントの乗っ取りのような、オペレーティングシステムやアプリケーションレベルのセキュリティ侵害は検出できません。
    お客さまサポート範囲の調査とリスク緩和の作業は、お客さまの責任となります。

GPUサーバー故障交換に関する注意事項

  • GPUサーバーの故障が発覚した際、GPUサーバー筐体一式の交換となり、GPUサーバーは新規状態のものをご提供いたします。
  • そのため、GPUサーバー上のデータ領域に保存されているデータは引き継がれません。重要なデータにつきましては、あらかじめお客様にて高速ストレージ等の外部ストレージへ保存いただきますようお願いいたします。
  • なお、OSについてはNVIDIA BCMサーバーにて、バックアップされたものを再インストールしてご利用可能です。

GPUサーバーの故障交換フロー

  • 障害発生の通知時に復旧作業候補日程をご連絡いたします。お客さまは復旧作業日の承認を行っていただく必要があります。
  • 障害通知時に同封の各交換作業候補日程のご回答期限は通知いたしました作業候補日程の6時間前といたします。(注1)
  • 復旧作業の日程が確定いたしましたら、お客さまにてGPUサーバーの電源を落としていただく必要があります。(電源を落としていただいていない場合、復旧作業を中断させていただくかKDDIにて強制的に電源を落とさせていただく可能性がございます)
  • GPUサーバー停止後、作業開始の4時間前までにコントロールパネルにて対象のGPUサーバーのステータスを”お客さまメンテナンス”に変更いただきます。(注2)
  • 故障対応後はKDDIにて正常性を確認したのちお客さまに作業完了を通知いたします。(KDDIにて問題が確認できない場合は、お客さまにて正常性確認を実施いただきます)
  • 故障対応が完了したGPUサーバーは電源を停止した状態でお客さまへ返却いたします。お客さまにて電源投入と必要に応じ正常性確認を実施ください。

    注1)ご回答期限までにご回答いただけなかった場合は、KDDIより個別にお客さまとご調整させていただきます。その際、障害通知時の作業日程での作業実施はお約束いたしかねますこと、あらかじめご承知おきください。
    注2)メンテナンスモード(お客さまメンテナンス)へのステータス変更が確認できない場合、登録いただいているご連絡先へメールでご連絡いたします。ご連絡がつかない場合は作業の実施を中断させていただきます。

キーワード検索