VMware Global Community
rendez_vouz
Contributor
Contributor

ESXiが行うデータストアへのハートビートについて

VMware vSphere 6.3 の仮想化基盤(ESXi)上でCentOS7.3のVMを立ち上げています。

VMはiSCSI接続されたストレージをマウントしているのですが、マウント

しているディスクがI/Oエラーとなる事象が度々起こっています。

こちら確認できた内容として、VMが起こしているI/OエラーはESXiがストレージ

に対して行っているハートビートがタイムアウトすることがあり、そのタイミング

にて発生しているらしいことまで特定しました。(※VMkernel.log)

-- VMkernel.log --

2018-MM-DDT23:58:33.419Z cpu17:36152)HBX: 2851: '*****02': HB at offset 3379200 - Waiting for timed out HB:

2018-MM-DDT23:58:33.419Z cpu17:36152)  [HB state abcdef02 offset 3379200 gen 195 stampUS 13957146104773 uuid ************ jrnl <FB 706200> drv 14.61 lockImpl 4]

2018-MM-DDT23:58:41.569Z cpu25:32859)HBX: 283: '*****02': HB at offset 3379200 - Reclaimed heartbeat [Timeout]:

2018-MM-DDT23:58:41.569Z cpu25:32859)  [HB state abcdef02 offset 3379200 gen 195 stampUS 13957166213383 uuid ************ jrnl <FB 706200> drv 14.61 lockImpl 4]

------------------

ですが、なぜハートビートのタイムアウトが発生するのかを特定できずに困っております。

仮想化基盤(筐体)、ストレージ、それらを繋ぐL2Switchでは故障などを含む異常は発生して

おりません。

似たような経験された方がもしおりましたらご助言頂けないでしょうか。

1 Reply
kawaman
Leadership
Leadership

状況ですが、vSphere 6.5を利用していて、

外部のiSCSIデータストアをマウントして、そこに(VMFSに)CentOS 7.3を仮想マシンとして立てている、という事でよろしいでしょうか?

切り分けのポイントとしては、構成が正しく接続・設定されているかになるかと考えます。

汎用的な切り分け方法は以下のKBが参考になります。

Troubleshooting iSCSI LUN connectivity issues on ESX/ESXi hosts

ESX/ESXi ホスト上の iSCSI LUN 接続問題のトラブルシューティング

iSCSIストレージの接続方法によってはポートバインディングの有無も関連があるかもしれません。
ESX/ESXi でソフトウェア iSCSI ポート バインディングを使用する際の考慮事項

また、特定のストレージによってはDelayed ACKの無効化が推奨される場合もあります(EMC、NetApp、PureStorageなどは無効化が推奨されることが多い)
特定のストレージ アレイを使用する ESX/ESXi ホストで読み取りまたは書き込みパフォーマンスの問題が生じる

また、ESXiにSSHなどでログインして、ストレージアクセスに利用しているNICの状態を確認し、エラーが出ているかの確認もお願いします。

esxcli network nic stats get -n vmnic<X>

MTUの違いやケーブル、SFPの問題などでエラーが出ている可能性もあります。

直接の原因ではないですが、この辺りを見て頂くと何か改善のカギがあるかもしれません。