VMware Global Community
ixuacu
Contributor
Contributor

HA No funciona correctamente vSphere 5

Buenas,

Tengo un blade de servidores IBM conectado a una cabina de discos mediante fibra.

Dispongo de 3 servidores con ESX 5 con 2 Datastores asignados.

Se configura un Cluster con los 3 servidores

Se configuran las opciones de HA para que en caso de Isolation se apaguen las VMs del servidor aislado.

El caso es que si cortamos la red de uno de los servidores, salta la alerta de que esta aislado pero no apaga las maquinas ni las levanta en alguno de los otros servidores. Sin embargo si ademas de la red le quitamos la conexion por fibra a los Datastores o desconfiguramos el Heartbit de Datastores entonces si que las levanta.

Creo que el problema viene con el uso del heartbit de Datastores que detecta que las maquinas estan operativas, pero no se porque no hace caso a la opcion de apagar las maquinas en caso de aislamiento.

Hay algun tipo de configuracion extra que se deba realizar para que realize el levantamiento de maquinas a pesar de haber perdido la conexion de red en el host?

Gracias,

Joaquín

Reply
0 Kudos
1 Reply
pcerda
Virtuoso
Virtuoso

Hola que tal,

Según lo que aparece en la documentación de VMware, este es un comportamiento normal en un cluster HA en vSphere 5:

The master host monitors the liveness of the slave hosts in the cluster. This communication is done through
the exchange of network heartbeats every second. When the master host stops receiving these heartbeats from
a slave host, it checks for host liveness before declaring the host to have failed. The liveness check that the
master host performs is to determine whether the slave host is exchanging heartbeats with one of the datastores.
See “Datastore Heartbeating,” on page 14. Also, the master host checks whether the host responds to ICMP
pings sent to its management IP addresses.
If a master host is unable to communicate directly with the agent on a slave host, the slave host does not respond
to ICMP pings, and the agent is not issuing heartbeats it is considered to have failed. The host's virtual machines
are restarted on alternate hosts. If such a slave host is exchanging heartbeats with a datastore, the master host
assumes that it is in a network partition or network isolated and so continues to monitor the host and its virtual
machines. See “Network Partitions,” on page 13.

La opción que tienes, es deshabilitar Datastore Heartbeat, con lo que tienes el comportamiento normal que tendrias en vSphere 4.x, perdiendo el nivel extra de protección incluido en vSphere 5.

Saludos,

Regards / Saludos - Patricio Cerda - vExpert 2011 / 2012 / 2013
Reply
0 Kudos