papavans
Enthusiast
Enthusiast

Как правильно диагностировать потерю пакетов в ВМ ?

Доброго времени суток! Подскажите пожалуйста, какие шаги предпринимать по диагностике дропа пакетов внутри ВМ ?

Смотрю perfmon в винде, смотрю esxtop %DRPRX, смотрю вкладку performance в vsphere клиенте и.. собственно всё.

1) С перфмоном в виндоусе вроде как все понятно, там можно посмотреть Packets recieved discarded для адаптера.

2) В esxtop есть такой параметр %DRPRX - откуда берется его значение?

3) Как мониторить через performance в vsphere cliente ? В контексте хоста ? На что обращать внимание?

4) И главный вопрос, как узнать что вызывает дроп пакетов ?

Ищу бест практис по диагностике дропа пакетов.

0 Kudos
9 Replies
AntonVZhbankov
Immortal
Immortal

Скажите, а в чем сама проблема заключается и откуда пришло понимание, что это именно дроп пакетов?

EMCCAe, MCITP: SA+VA, VCP 3/4/5, VMware vExpert http://blog.vadmin.ru
0 Kudos
papavans
Enthusiast
Enthusiast

Проблема заключается в том, что разваливается кластер exchange dag, в ивент вьюере винды видна такая ошибка для нескольких серверов:

Cluster node 'VM-EXMB03' was removed from the active failover cluster membership. The Cluster service on this node may have stopped. This could also be due to the node having lost communication with other active nodes in the failover cluster. Run the Validate a Configuration wizard to check your network configuration. If the condition persists, check for hardware or software errors related to the network adapters on this node. Also check for failures in any other network components to which the node is connected such as hubs, switches, or bridges.

В некоторые моменты времени зафиксирована потеря пакетов, думаю что проблема в этом.

Пробовал затюнить сетевые интерфейсы по статье VMware KB: Large packet loss at the guest OS level on the VMXNET3 vNIC in ESXi 5.x / 4.x  но это не помогло.

0 Kudos
AntonVZhbankov
Immortal
Immortal

Как собраны кластеры VMware и Exchange? Как собраны виртуальные сети?

>думаю что проблема в этом

Вы уверены, что это и есть проблема, а не ее сипмтом?

EMCCAe, MCITP: SA+VA, VCP 3/4/5, VMware vExpert http://blog.vadmin.ru
0 Kudos
papavans
Enthusiast
Enthusiast

Кластер состоит из 15 хостов (24vcpu 100gb ram), по 6 vmnic на каждом. 4 vmnic'а с каждого из хостов подключены в dvSwitch, портгруппы которого как раз используются в ВМ под эксчейндж кластер. Тиминг и фейловер - route based on physical nic load.

Всего ВМ в ексчейндж кластере 4 штуки, каждая по 6vcpu и 32Gb ram.

Какая именно информация интересна по эксчейнджу ?

0 Kudos
yavg
Contributor
Contributor

Присоединяюсь к вопросу.

Столкнулись с аналогичными симптомами на mssql alwayson availability group (failover cluster). Под нагрузкой иперфом иногда растет счетчик Packets recieved discarded. Пробовал изменение настроек vmxnet3 и отключение Receive-Side Scaling State. Немного подняв лимиты пропущенных хартбитов и время между ними, замаскировали проблему. Склоняюсь к тому, что проблема не в dvSwitch или сетевой.

0 Kudos
Dmitry_G
Hot Shot
Hot Shot

Какая версия vSphere? Как подключена система хранения? Какая политика мultipathing'а?

VCAP-DCD, VCAP-DCA, VCP-Cloud, VCP-DCV, CCNA
0 Kudos
papavans
Enthusiast
Enthusiast

vcenter 5.1.0 build 1064983

esxi 5.1.0, 1065491

Система хранения подключена по FC. На каждом хосте по 2 FC HBA. Path selection выставлена Round Robin (VMware), storage array type - VMW_SATP_ALUA.

0 Kudos
Dmitry_G
Hot Shot
Hot Shot

Данная конфигурация является не поддерживаемой,With native multipathing (NMP), clustering is not supported when the path policy is set to round robin.

Скорее всего отсюда все проблемы, сеть тут не при чем.

КБ для ознакомления  VMware KB: Microsoft Cluster Service (MSCS) support on ESXi/ESX

VCAP-DCD, VCAP-DCA, VCP-Cloud, VCP-DCV, CCNA
0 Kudos
papavans
Enthusiast
Enthusiast

Небольшая поправка. Диски на машинах являются простыми vmdk дисками на датасторах, это не RDM луны подключенные на прямую в ВМ. Общих дисков между этими ВМ нету.

0 Kudos