VMware vSphere 6.3 の仮想化基盤(ESXi)上でCentOS7.3のVMを立ち上げています。
VMはiSCSI接続されたストレージをマウントしているのですが、マウント
しているディスクがI/Oエラーとなる事象が度々起こっています。
こちら確認できた内容として、VMが起こしているI/OエラーはESXiがストレージ
に対して行っているハートビートがタイムアウトすることがあり、そのタイミング
にて発生しているらしいことまで特定しました。(※VMkernel.log)
-- VMkernel.log --
2018-MM-DDT23:58:33.419Z cpu17:36152)HBX: 2851: '*****02': HB at offset 3379200 - Waiting for timed out HB:
2018-MM-DDT23:58:33.419Z cpu17:36152) [HB state abcdef02 offset 3379200 gen 195 stampUS 13957146104773 uuid ************ jrnl <FB 706200> drv 14.61 lockImpl 4]
2018-MM-DDT23:58:41.569Z cpu25:32859)HBX: 283: '*****02': HB at offset 3379200 - Reclaimed heartbeat [Timeout]:
2018-MM-DDT23:58:41.569Z cpu25:32859) [HB state abcdef02 offset 3379200 gen 195 stampUS 13957166213383 uuid ************ jrnl <FB 706200> drv 14.61 lockImpl 4]
------------------
ですが、なぜハートビートのタイムアウトが発生するのかを特定できずに困っております。
仮想化基盤(筐体)、ストレージ、それらを繋ぐL2Switchでは故障などを含む異常は発生して
おりません。
似たような経験された方がもしおりましたらご助言頂けないでしょうか。