FooterIT
Contributor
Contributor

Lost access to volume \ Successfully restored access to volume

Всем привет!

Прошу помощи в данной проблеме, не знаю что делать!

Так уж вышло что столкнулся с виртуализацией и работаю с ней 2 месяца и нихрена не понимаю)

Собрали кластер на esxi 6.5 update 2 build 8294253 ,железо новое  2x xeon gold 6148 @ 2,40 GHz, 512 GiB оперативы, СХД netapp, коммутаторы mellanox

проблема в следующем, постоянно отваливается LUN с такими сообщениями

Lost access to volume 5c1b77ce-ba940de0-74f0-506b4bc1ee0c (SYS DATASTORE) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly.

Successfully restored access to volume 5c1b77ce-ba940de0-74f0-506b4bc1ee0c (SYS DATASTORE) following connectivity issues.

Alarm 'Cannot connect to storage': an SNMP trap for entity esx02 was sent

Alarm 'Cannot connect to storage' on esx02 triggered by event 2048423 'Path redundancy to storage device naa.600a098000e445cd000053b85c1b464c degraded. Path vmhba64:C13:T0:L9 is down. Affected datastores: Unknown.'

Alarm 'Cannot connect to storage' on esx02 triggered by event 2048421 'Path redundancy to storage device naa.600a098000e44613000002f15c1b464f degraded. Path vmhba64:C13:T0:L8 is down. Affected datastores: Unknown.'

Таких сообщений за 10 минут на 10 листов А4, соответсвенно работать не возможно, на виртуалках работает SQL и 1C . Кстати пинги из виртуалок разных хостов ходять без проблем, похереных пакетов нету,  а тупчик идет!

Хостов у нас таких 4, 1 СХД, 2 коммутатора  - отказоустойчивый кластер (типа)

Что пробовали;

Пробовали ставить другие драйвера на сетевухи  такие 3.15.11-10 of the Mellanox nmlx4_en 10Gb/40Gb Ethernet driver on ESXi6.0Ux/ESXi6.5Ux. , версии 4 и 5 тоже пробовали

ничего не выходит!

Скажите пожалуйста как правильно диагностировать проблемы данного типа и как с ними бороться, а главное как побороть данный недуг?)

0 Kudos
1 Reply
Finikiez
Champion
Champion

Добрый день!

Правильно начать с чтения vmkernel.log серверов и SCSI ошибок.

Поясните, пожалуйста, вы пишите, что пробовали менять версию сетевого драйвера. В то же самое время кусок вашего лога говорит о блочном доступе к СХД через адаптер vmhba64.

Вопрос - что это за адаптер и как NetApp подключен? это FCoE или что?

0 Kudos