VxRail:ESXiホストがvCenter上で"応答無し(not responding)"となった際の対応例

VxRail:ESXiホストがvCenter上で"応答無し(not responding)"となった際の対応例

はじめに

"応答無し(not responding)"が発生する要因については、VMware社から以下KBで解説されています。

   - ESXi ホストが「応答なし」または「切断」と表示される理由について (2127000)

     https://kb.vmware.com/s/article/2127000

本記事では、その中でも以下問題に遭遇した際の代表的な対応手順をご紹介します。

・ESXi ホストに紫色の診断画面(PSOD)が表示される。

・ESXi ホスト上で hostd プロセス または vpxaエージェントが応答を停止した。

なお、障害内容によって全く同じ状況とは限りませんので、

仔細が異なる場合は必ず御締結されている各サポート先へお問い合わせ下さい。

ESXiホストが「応答なし」になった際のエラー表示例

VxRail Manager

対象のESXiホストが、LOST(消失)ステータスになっている。

1.png

対象のESXiホストにアクセスできないイベント(MYSTIC1000001)が発報されている。

2.png

web client

対象のESXiホストが"応答なし(not responding)"ステータスとして表示される。

3.png

対象ホストの[サマリ]タブで以下アラートが記録される

4.png

紫色の診断画面(PSOD)が発生している場合

想定されるシチュエーション

PSODが発生した場合,対象ホスト上にある仮想マシンの挙動は以下のように異なります

(HAの諸設定によって細かな挙動は変わって参りますので予めご了承下さい)。

    HAが有効化されている場合:対象のESXiホスト上に存在していた仮想マシンが再起動し、   

               別ESXiホストで稼働します。

    HAが無効化されている場合:対象のESXiホスト上に存在する仮想マシンは(切断状態)となり、

               アクセスが不能となります。

5.png

また、host clientはログイン画面すら表示されなくなります。

必要なアクション

1.BMCの仮想コンソール機能を利用してDCUIをチェックし、PSODが発生していれば画面キャプチャをご取得下さい。

    BMCの操作やPSOD画面キャプチャの取得については、以下コミュニティ情報をご参考下さい

    VxRail:PSOD画面取得 (Quanta Model: MegaRACSP)

    VxRail:BMCの仮想コンソール機能を利用してDCUIを操作する

2.PSOD画面キャプチャを取得した後は物理的にサーバーの電源ボタンをOFF/ON頂くか、

   以下記事を参考に BMCを利用して再起動を行ってください。

     EMC Community Network - DECN: VxRail:BMCを利用した電源制御

3.正常にESXiが起動してきた後は vm-supportを取得し、PSOD画面キャプチャと合わせてサポートへお問い合わせ下さい。

    VxRail: vm-suuportログ取得手順(vSphere Web Client利用)

hostd / vpxaが停止している場合

想定されるシチュエーション

hostd/vpxaが応答を停止した場合、対象のESXiホスト上に存在する仮想マシンは(切断状態)となりますが、

正常に動作を継続します。これは hostd/vpxa が ESXi -- vCenterの管理連携に関わるコンポーネントであるためです。

6.png

また、PSOD発生時と異なり 対象ESXiホストのhost clientはログイン画面までは表示されますが、

ログインしようとするとタイムアウトし失敗します。

7.png

BMCの仮想コンソール機能を利用してDCUIへログインし、 [Alt] + [F11]を押下すると、

"hostd detected to be non-responsive " というメッセージが表示されている。

    VxRail:BMCの仮想コンソール機能を利用してDCUIを操作する https://community.emc.com/docs/DOC-66079

8.png

必要なアクション

1.[Alt] + [F1]を押下し、ESXi Shellを開きます。

   問題なくコマンドが入力できる場合、2.に進んでください。

  9.png

   以下のようにログイン画面が表示されずプロンプトのみ表示される場合、ESXi Shellが無効化されているため、有効化が必要です。

10.png

   ESXi Shellを有効化するために[Alt] + [F2]を押下してDCUI main menuへ移行の上[F2]を選択し、rootでログインします。

   その際、キーボード配列が英字になっていますので特殊文字の入力にご注意ください。

    [login Name:]欄であれば文字が表示されるため、[tab]キーを押して移動し

   どのキーでどの特殊文字が表示されるが事前にご確認下さい。

11.png

  ログイン後、[Troubleshoot Option] を選択します。

12.png

  [Enable ESXi Shell]をenterし、Shellを有効化します。

  有効化後、[ESC]キーを2回押下すれば、DCUIメイン画面に戻ります。

   改めて[Alt]キー + [F1]キーを選択してログインプロントが表示されることをご確認下さい。 13.png

2.以下コマンドを入力します。

   # /etc/init.d/hostd restart

   # /etc/init.d/vpxa restart

実行例)

[root@sds-02:~] /etc/init.d/hostd restart

                           watchdog-hostd: Terminating watchdog process with PID 67965

                             hostd stopped.

                             hostd started.

[root@sds-02:~] /etc/init.d/vpxa restart

                           watchdog-vpxa: Terminating watchdog process with PID 68308

                             vpxa stopped.

                             vpxa started.

[root@sds-02:~] /etc/init.d/hostd status   //サービスの稼働状況確認//

                             hostd is running

[root@sds-02:~] /etc/init.d/vpxa status    //サービスの稼働状況確認//

                             vpxa is running

3.本コマンド実行後、しばらくしてから Web Client で対象ホストのステータスが

   “not responding”から正常に切り替わったことをご確認下さい。

   その後、vm-supportを取得して弊社サポートへお問い合わせ下さい。

    VxRail: vm-support取得方法(vSphere Client利用)

参考資料:

  - ESXi ホストが「応答なし」または「切断」と表示される理由について (2127000)

     https://kb.vmware.com/s/article/2127000

   - How to access DCUI/Console of ESXi using ALT+F Keys (2148363)

      https://kb.vmware.com/s/article/2148363

   - ESX/ESXi ホストのパープル スクリーンの解析 (1033242)

     https://kb.vmware.com/kb/1033242

Version history
Revision #:
1 of 1
Last update:
‎06-27-2019 02:13 AM
Updated by: