Buenas, os propongo un ejercicio.
Tenemos una infraestructura con varios clústers con Ha y un vCenter físico con BD en cabina de discos. De golpe se va la luz, los SAIS han fallado y oh! todo cae de golpe.
La luz vuelve al cabo de unos minutos y los ESX y la cabina de discos arrancan. el servidor vCenter no ha caído y se ha quedado sin disco, de forma que el SQL-Server está en una mala situación.
Al arrancar los ESX ninguna VM se arranca, y eso que los clústers tienen HA configurado.
Sólo al reiniciar el vCenter y el disco de datos de la BD de SQL-Server vuelve a reconectarse con Windows, el sistema empieza a arrancar VM's.
Por qué HA no ha arrancado las VM's nada más arrancar los ESX dentro de cada clúster y lo ha hecho al reiniciar el vCenter? En teoría, si no recuerdo mal, una vez configurado HA, no hace falta el vCenter para que esta tecnología funcione.
Saludos!
Según conversaciones con VMware todas las sospechas que tenía son ciertas, así como vuestros comentarios, tanto en el caso de un arranque de cero, tras la pérdida absoluta de todo el servicio, como en la reactivación de vCenter.
Saludos.
Hola,
Yo pienso que al tratarse de una caída completa, sin el vCenter, para el HA no ha habido un evento de Failover sino que es un arranque de primeras y salvo que se tenga configurado en cada host ESXi el arranque automático de las VMs que aloja nunca arranca ninguna.
Cuando todo está funcionando (excepto el vCenter en todo caso) cuando se cae un host el HA lo detecta y lanza el Failover pero en este caso todo está apagado y se enciende de nuevas con lo que en apariencia para el HA es un arranque normal y por tanto, sin vCenter por medio, cada host ESXi de forma individual se comportará en función de lo que tenga configurado en el apartado de configuración de arranque/parada de las VMs.
Un saludo,
Ciertamente es lo que pienso. Al caerse todos los hosts, no quedó ninguno con el rol de Master para indicar al resto la caída. el primero que arrancó dijo:
- Buenos días. ¿Dónde está el host master? ¿No hay y no estoy aislado? Pues ale, ahora soy yo el Master.
Y luego al entrar en el clúster los otros hosts dijeron:
- Qué pasa Master! ¿Ha pasado algo?
Y el nuevo host con rol de master les dijo que no pasaba nada.
Lo que no acabo de ver es porqué al reiniciar el servidor de vCenter de forma manual, donde supongo reconectó el servicio de vCenter correctamente, las VM's empezaron a arrancarse por HA. Yo creo que es porque al arrancar el vCenter les dijo a los ESX:
- Ojo!!! Que nos hemos caído! Mi última foto antes de todo este follón es que teníais las VM's arrancadas!
Y los hosts arrancaron las VM's entonces.
¿Alguien puede confirmar o desmentir este último punto que no queda demasiado claro?
:smileygrin:
Saludos!
Hola,
Efectivamente este último punto no está claro del todo y a ver si alguien nos puede dar una certeza. Por mi parte estoy de acuerdo contigo en que seguramente al arrancar el vCenter y activar todas las funcionalidades de HA y DRS se dijo, ey esto tiene que estar todo arrancado y el usuario del sistema se encargo de arrancar todas las máquinas disponibles en el inventario....
Un saludo,
Hola,
el vcenter se encarga de activar en un primer momento el HA y posteriormente da la opción de gestionar el HA.
Pero el vcenter no es necesario para ejecutar el HA.
Lo que creo que pasó en tu escenario es que hasta que no se inició correctamente el vcenter (ya tenia acceso a la bd del vcenter) no se activó realmente el HA.
Una vez activado el HA, se empezaron a iniciar las mv automáticamente por HA.
Un saludo,
Pablo
Según conversaciones con VMware todas las sospechas que tenía son ciertas, así como vuestros comentarios, tanto en el caso de un arranque de cero, tras la pérdida absoluta de todo el servicio, como en la reactivación de vCenter.
Saludos.