0 Replies Latest reply on May 30, 2017 3:38 AM by AMIhalchuk

    Проблема с iowait на контроллере p420 ESXI 6.5

    AMIhalchuk Lurker

      Добрый день!

       

      Нашей компанией для собственных нужд используется сервер HP ProLiant P4300 Gen2 в конфигурации 2xE5520, 24Гб ОЗУ с контроллером HP p420, на котором собран RAID5 из 4 дисков 6Тб SAS HGST, на нем развернут гипервизор ESXI 6.5 в котором этот RAID смонтирован в качестве локального датастора. На данный момент на нем работают 3 гостевые ОС CentOS и Debian, нагрузка на CPU гипервизора не превышает 10-20%, памяти 60-80%, диски загружены примерно наполовину.

       

      Недавно у нас произошел инцидент: резко возросли показатели CPU iowait на виртуальных машинах гипервизора, в короткий промежуток времени машины стали недоступны (зависли), выключить/перезапустить их из гипервизора так же не удалось, сервер был перезагружен вручную. При запуске и инициализации ошибок не возникло, на данный момент сервер работает в штатном режиме. При анализе логов обнаружилась ошибка вида:

       

      2017-05-26T03:31:27.172Z cpu7:788405)WARNING: VSCSI: 3488: handle 8228(vscsi0:1):WaitForCIF: Issuing reset; number of CIF:17 (время в UTC).

       

      Свидетельствует ли это о возможном сбое контроллера/дисков?

       

      Перед инцидентом производилась запись на одной из виртуальных машин, трафик около 50Мб/с.

       

      Хотелось бы узнать, возможно требуется подключение какого-либо дополнительного драйвера для контроллера или тонкая настройка гипервизора? На странице поддержки HP доступны драйверы для контроллера для VSphere 6.5, а так же набор утилит HPE SSA Cli, возможно их установить на гипервизоре? Может ли это быть аппаратной проблемой? Заранее благодарны за помощь.