VMware Global Community
igarcia
Enthusiast
Enthusiast
Jump to solution

Problemas HA/DRS

Hola a todos,

Me gustaría ver si alguno de los presentes me puede aclarar un problema que tengo con HA/DRS

Explico cual es la situación:

- 3 Servidores ESXServer 3.5 con HA/DRS activo.

- Isolate response "Shutdown VM"

- VM restart priority "Low"

- Number of Host Failures the cluster can tolerate "1"

En el mismo tengo una infraestructura de servidores + workstations (Virtual servers + VDI)

En HA tengo 3 servidores en "High Priority" Servidor de DOMINIO + 2 VM servidores VDI, el resto de máquinas virtuales

las tengo en priority "low".

El problema lo tengo al hacer las pruebas de 0 en el sistema (Corte de LUZ repentino, Servidores y Almacenamiento).

El almacenamiento levanta sin problema alguno y los servidores ESX lo hacen también, el problema está en que cuando

levanta el primer servidor ESX no hace nada con las máquinas que estan en "High Priority" ni las mueve ni las arranca.

Espera a estar el 2º ESXServer activo para empezar a levantar máquinas sin tomar en cuenta las prioridades dadas en HA

por lo que al final se levantan las máquinas de VDI sin estar antes servidores DNS/DHCP/DOMINIO y rebienta todo.

Preguntas:

- Es posible hacer crear dependencias entre máquinas ?? (Me he remirado toda la documentación y no encuentro la forma)

ejem: Hasta que no se levanten las máquinas "VM1,VM2, VM3 ... no levantar el resto de máquinas"

- Existe alguna documentación donde se detalle todas las opciones avanzadas de HA/DRS (Las configurables en Advanced Options...)

Muchas gracias a todos.

igarcia

0 Kudos
1 Solution

Accepted Solutions
jose_maria_gonz
Virtuoso
Virtuoso
Jump to solution

Hola Igarcia,

No molestas, es mas, todos aprendemos de todos. Si tienes bien configurado HA, funciona de "lujo", es decir, es para lo que es, para protegerte contra fallos hardward y con la nueva versión vSphere también te "protege" contra fallos del OS del la MV guest.

Saludos,

Jose Maria Gonzalez,

Founder and President of JmGVirtualConsulting.com

-


See http://www.JmGVirtualConsulting.com for official Vi3 and vSphere consultancy

See http://www.josemariagonzalez.es for my blog on VMware training and tips

See http://www.twitter.com/jose_m_gonzalez for some twittering

VMware vExpert 2009

Autor del Libro VMware ESX y VMware VCP Hecho Fácil

-


If you find this or any other answer useful please consider awarding points by marking the answer helpful or correct.

<a href="http://feedproxy.google.com/ElBlogDeVirtualizacionEnEspanol">!http://feedproxy.google.com/ElBlogDeVirtualizacionEnEspanol.2.gif!</a>

View solution in original post

0 Kudos
13 Replies
jose_maria_gonz
Virtuoso
Virtuoso
Jump to solution

Hola Igarcia,

Como tienes el control de admisión en la configuración del Clusters?

Tienes puestas reservas (de memoria y CPU) en MVs?

Cual es el valor de Current Failover Capacity y Configured Failover Capacity?

Saludos,

Jose Maria Gonzalez,

Founder and President of JmGVirtualConsulting.com

-


See http://www.JmGVirtualConsulting.com for official Vi3 and vSphere consultancy

See http://www.josemariagonzalez.es for my blog on VMware training and tips

See http://www.twitter.com/jose_m_gonzalez for some twittering

VMware vExpert 2009

Autor del Libro VMware ESX y VMware VCP Hecho Fácil

-


If you find this or any other answer useful please consider awarding points by marking the answer helpful or correct.

<a href="http://feedproxy.google.com/ElBlogDeVirtualizacionEnEspanol">!http://feedproxy.google.com/ElBlogDeVirtualizacionEnEspanol.2.gif!</a>

0 Kudos
igarcia
Enthusiast
Enthusiast
Jump to solution

Hola Jose María

Como estás compañero ...

Te adjunto pantallazo del HA, con el que quedan contestadas tus preguntas.

Admision Control: Allow Constrains violations ( Para que levante máquinas hasta que no pueda más)

Current Failovel Capacity: 1 host

Configured Failover Capacity : 1 host

En cuanto a las reservas de VM's tengo 2 Resource Pools

Uno para Servidores y otro para Workstation (VDI's)

En el Resource Pool de Servidores

CPU Share Resources

High

Memory Share Resources

High

En el Resource Pool de WorkStations

CPU Share Resources

Normal

Memory Share Resources

Normal

0 Kudos
igarcia
Enthusiast
Enthusiast
Jump to solution

Hola Jose María

Como estás compañero ...

Te adjunto pantallazo del HA, con el que quedan contestadas tus preguntas.

Admision Control: Allow Constrains violations ( Para que levante máquinas hasta que no pueda más)

Current Failovel Capacity: 1 host

Configured Failover Capacity : 1 host

En cuanto a las reservas de VM's tengo 2 Resource Pools

Uno para Servidores y otro para Workstation (VDI's)

En el Resource Pool de Servidores

CPU Share Resources

High

Memory Share Resources

High

En el Resource Pool de WorkStations

CPU Share Resources

Normal

Memory Share Resources

Normal

Saludos

0 Kudos
mokymura
Expert
Expert
Jump to solution

Hola

Que configuración tienen esas 3 VM con high priority, pudiera ser que no fuera capaz de levantar las 3 en 1 mismo ESX? y por ello espere al otro ESX para empezar a levantar máquinas?

Saludos

If you find this or any other answer useful please consider awarding points by marking the answer helpful or correct.

Si encuentras esta u otras respuesta útiles, por favor considera el asignar puntos seleccionando la respuesta como útil o correcta If you find this or any other answer useful please consider awarding points by marking the answer helpful or correct.
0 Kudos
igarcia
Enthusiast
Enthusiast
Jump to solution

Hola Mokymura,

Las máquinas virtuales con alta prioridad tienen:

VM1 : 1vCPU, 2048 mb RAM

VM2 : 2vCPU, 512 mb RAM

VM3 : 2vCPU, 768 mb RAM

Yo creo que con los recursos de los que dispongo, deberían levantar de sobra. Es raro.

0 Kudos
igarcia
Enthusiast
Enthusiast
Jump to solution

Y digo yo .... ahora que me fijo.

Teniendo un cluster formado por 3 ESX Servers no debería estar el

Current Failover Capacity : 3 hosts ???

0 Kudos
jose_maria_gonz
Virtuoso
Virtuoso
Jump to solution

Hola Igarcia:

Con un cluster HA en:

Current Failovel Capacity: 1 host

Configured Failover Capacity : 1 host

solo podrás tener una caída de un servidor ESX en un cluster de 3 nodos.

Pregunta tonta, pero como simulas la caida de un ESX para ver si HA funciona? Lo normal es que desconectes el Service Console, en caso de solo tener un puerto para el service console, o las dos interfaces de red de los dos Service Console (mejores practicas). "Tirando" la cabina de almacenamiento, no conseguirás que HA levante las maquinas.

Recuerda, HA solo te protege contra las caídas de hardward de los ESX.

Saludos,

Jose Maria Gonzalez,

Founder and President of JmGVirtualConsulting.com

-


See http://www.JmGVirtualConsulting.com for official Vi3 and vSphere consultancy

See http://www.josemariagonzalez.es for my blog on VMware training and tips

See http://www.twitter.com/jose_m_gonzalez for some twittering

VMware vExpert 2009

Autor del Libro VMware ESX y VMware VCP Hecho Fácil

-


If you find this or any other answer useful please consider awarding points by marking the answer helpful or correct.

<a href="http://feedproxy.google.com/ElBlogDeVirtualizacionEnEspanol">!http://feedproxy.google.com/ElBlogDeVirtualizacionEnEspanol.2.gif!</a>

igarcia
Enthusiast
Enthusiast
Jump to solution

He visto que si la parada de los servidores, bien desconectando el puerto de la SC o bien apagando el servidor "tirando del cable de alimentación" el HA entra sin problemas y realiza el balanceo de máquinas mas o menos de forma aceptable.

Mi problema tal y como hablamos aquel día ... es que se me vaya la LUZ y el SAI agote los 30-40 minutos.

Al encender y simular una caida total del sistema ... necesito encarecidamente que 3 máquinas enciendan antes que ninguna otra, ya que son las que levantan servicios básicos de red (DHCP, DNS, LDAP) y en base a eso todas las demás se autoconfiguran.

Que puedo hacer al respecto?

Un abrazo.

igarcia.

0 Kudos
jose_maria_gonz
Virtuoso
Virtuoso
Jump to solution

Hola Igarcia,

Instala el agente para linux de tu SAI en el Service Console y prueba a hacer un apagado limpio en caso de que la luz se vaya con "halt"

Chequea que tu software del SAI tiene un agente para linux. Recuerda que el OS del Service Console esta basado en RH 5.2 Enterprise

No obstante, si tu Site entero se cae, HA no te protegerá contra este tipo de fallos, pues probablemente todos los nodos del cluster estén "muertos".

Saludos,

Jose Maria Gonzalez,

Founder and President of JmGVirtualConsulting.com

-


See http://www.JmGVirtualConsulting.com for official Vi3 and vSphere consultancy

See http://www.josemariagonzalez.es for my blog on VMware training and tips

See http://www.twitter.com/jose_m_gonzalez for some twittering

VMware vExpert 2009

Autor del Libro VMware ESX y VMware VCP Hecho Fácil

-


If you find this or any other answer useful please consider awarding points by marking the answer helpful or correct.

<a href="http://feedproxy.google.com/ElBlogDeVirtualizacionEnEspanol">!http://feedproxy.google.com/ElBlogDeVirtualizacionEnEspanol.2.gif!</a>

0 Kudos
igarcia
Enthusiast
Enthusiast
Jump to solution

Efectivamente, ese es el caso que estoy tomando, caída total del SITE y arranque de todo el sistema desde 0

Es un caso que dificilmente se nos dé, pero es cierto que alguna vez ha pasado. En los últimos 6 años yo recuerdo

1 o como mucho 2 veces.

Mi pregunta es:

Por que si tengo 3 nodos y las VM's prioritarias están en uno de ellos, arranca uno de los nodos diferente al que están las maquinas prioritarias.

Éstas no son arrancadas de inmediato?

  • ¿Hay forma de crear algun tipo de dependencia entre máquinas ? a nivel de todo el site.

  • ¿ Existe algun documento con todas las Advanced Options de HA/DRS ? - Las claves de registro -

Thanks again

0 Kudos
eadan
Enthusiast
Enthusiast
Jump to solution

Hola:

Aquí tienes varios problemas:

Si se te va la luz de todo el HA, como comenta Jose Maria, no te va a servir de nada porque no hay ningún nodo funcionando. Igualmente tienes un problema mas importante y es que si el Storage se queda sin luz todo el entorno se te vendrá a bajo, es más, si arrancan antes los ESX sin que arranque la SAN posiblemente las VM no arranquen ya que a lo mejor tendrás que hacer un reescan para poder ver los Datastore.

Respecto a porque te arrancan las VM en otro hosts al que tienes "asignado"... Dentro del cluster HA a un nodo que hace la función de Master y este siempre va a ser el primero que se levante (normalmente es el primero hosts que pones dentro del cluster HA) ya que el resto de nodos se tienen que poner en contacto con el por primera vez.

Yo seguieria los consejos que te ha dado Jose Maria para realizar un apagado controlado.

Saludos.

igarcia
Enthusiast
Enthusiast
Jump to solution

Hola,

Efectivamente ya tengo claro todo el proceso, en cuanto a la caida del SITE en la SAN no tengo problemas, siempre arranca antes que los ESX, de todos modos los servidores ante un "0" arrancan 2 veces, tiempo mas que suficiente para que arranque el "storage".

Yo no es que me "emperre" en "fastidiar" al sistema, pero es un caso que se puede dar y quiero estar seguro de cual va a ser el comportamiento del mismo.

0 Kudos
jose_maria_gonz
Virtuoso
Virtuoso
Jump to solution

Hola Igarcia,

No molestas, es mas, todos aprendemos de todos. Si tienes bien configurado HA, funciona de "lujo", es decir, es para lo que es, para protegerte contra fallos hardward y con la nueva versión vSphere también te "protege" contra fallos del OS del la MV guest.

Saludos,

Jose Maria Gonzalez,

Founder and President of JmGVirtualConsulting.com

-


See http://www.JmGVirtualConsulting.com for official Vi3 and vSphere consultancy

See http://www.josemariagonzalez.es for my blog on VMware training and tips

See http://www.twitter.com/jose_m_gonzalez for some twittering

VMware vExpert 2009

Autor del Libro VMware ESX y VMware VCP Hecho Fácil

-


If you find this or any other answer useful please consider awarding points by marking the answer helpful or correct.

<a href="http://feedproxy.google.com/ElBlogDeVirtualizacionEnEspanol">!http://feedproxy.google.com/ElBlogDeVirtualizacionEnEspanol.2.gif!</a>

0 Kudos