VMware Global Community
AlvaroCo
Contributor
Contributor

Perdida de gestion ESX

Buenos días,

Tengo una infraestructura de 5 host ESX 4.1, el caso es que uno de ellos pierde de vez en cuando la gestion total, he probado a reiniciar los servicios de gestion y  a seguir los documentos de conectividad sin conseguir nada. Hace como un mes lo reinstale y todo bien hasta ayer que le volvio a pasar lo mismo, se deja de tener gestion de host, las VM siguen funcionando, al acceder por consola al host se queda al intentar navegar por los directorios no permite el acceso a "volumes" y  a varios directorios, no da error se queda intentandolo.

El hardware no da aviso de ningun error, son DL580G7 con una EVA 8400.

¿Alguna sugerencia?

Gracias.

Saludos.

Reply
0 Kudos
13 Replies
FerrerDeCouto
Commander
Commander

Hola AlvaroCo:

Imagino que te refieres que cuando accedes a /vmfs/volumes se queda "colgado" ¿no?

Un saludo.

José Luis Gómez Ferrer de Couto Founder of PiPo e2H Blog: http://blog.e2h.net Si encuentras que esta o cualquier otra respuesta fue de utilidad, por favor da el voto. Gracias. If you find this or any other answer useful, please consider awarding points. Thank you.
Reply
0 Kudos
AlvaroCo
Contributor
Contributor

Correcto, se queda ahí ni deja salir ni da error.

Intente entrar para apagar alguna maquina a mano y ver si al levantarla lo hacia en otro host pero es imposible.

Reply
0 Kudos
FerrerDeCouto
Commander
Commander

Hola AlvaroCo:

Eso ocurre cuando el host ha perdido los caminos con el almacenamiento y no es capaz de encontrar los datastores que tengas creados. ¿Has comprobado que no aparece error alguno en la cabina?, probaría también con ese host si tienes multipathing dejar únicamente un camino y probar uno y otro a ver cómo se comporta.

¿Es FC o iSCSI?

Un saludo.

José Luis Gómez Ferrer de Couto Founder of PiPo e2H Blog: http://blog.e2h.net Si encuentras que esta o cualquier otra respuesta fue de utilidad, por favor da el voto. Gracias. If you find this or any other answer useful, please consider awarding points. Thank you.
Reply
0 Kudos
klauzser
Contributor
Contributor

Tengo el mismo problema. No puedo acceder a la opción de volumen. Se sigue colgando cada vez que intente utilizarlo.

Reply
0 Kudos
AlvaroCo
Contributor
Contributor

Error en la cabina no hay, ademas el resto de host acceder correctamente a esos datastores.

El acceso es FC y si es multi, tirare por ese camino de error en HW de accesoa cabina.

¿Conoceis alguna manera de poder migrar las maquinas a los otros host, mejor sin apagarlas claro?. Los datastores si los ven los otros.

Saludos.

Reply
0 Kudos
FerrerDeCouto
Commander
Commander

Hola AlvaroCo:

Me refería en avisos en la cabina referente a path preferred. Deberías comprobar los accesos de ese host en concreto al almacenamiento, ya que cuando se queda colgado en esa ruta es por problemas en listar los VMFS accesibles por FC o iSCSI.

Las VMs no las podrás migrar en caliente ya que vCenter ve el host como no accesible.

Un saludo.

Sent from my iPhone

José Luis Gómez Ferrer de Couto Founder of PiPo e2H Blog: http://blog.e2h.net Si encuentras que esta o cualquier otra respuesta fue de utilidad, por favor da el voto. Gracias. If you find this or any other answer useful, please consider awarding points. Thank you.
Reply
0 Kudos
AlvaroCo
Contributor
Contributor

Hola,

Si que he encontrado cambios de patch en la cabinade los vdisk, he de decir tambien que el disco de boot del host tambien esta en la cabina, ¿crees que puede ser por esto?. Me imagino que solo serán micro cortes. ¿a que puden ser debidos?¿alguna solución?.

Los discos estan en Failover/Failback como creo que recomiendan para ESX.

Gracias.

Reply
0 Kudos
FerrerDeCouto
Commander
Commander

Hola AlvaroCo:

Lo primero que haría en cuanto tengas opción es arrancar esas VMs en los otros hosts si es posible y dejar ese host aislado hasta detectar el error concreto.

Una vez hecho lo anterior si es posible efectuaría los siguientes pasos:

  1. Comprobar que la LUN boot from SAN de cada host es visible UNICAMENTE por ese host por los X caminos que tenga. Mostrarle sólo la LUN de BOOT.
  2. Comprobar que el zoning o masking de los switches FC están correctamente para todos los PATHS, es común que nos dejemos algún PATH fuera.
  3. No actives el FAILBACK, ya que si está fallando algún cable o dispositivo estará conmutando continuamente generando "path trashing". KB1020692.

Un saludo.

José Luis Gómez Ferrer de Couto Founder of PiPo e2H Blog: http://blog.e2h.net Si encuentras que esta o cualquier otra respuesta fue de utilidad, por favor da el voto. Gracias. If you find this or any other answer useful, please consider awarding points. Thank you.
Reply
0 Kudos
AlvaroCo
Contributor
Contributor

Hola,

He comprobado que la lun de Boot solo es visible por el host, tambien he revisado el zoning y esta correcto, 4 tarjetas del host y 8 de la cabina.

He dejaod el disco en "Failover Only".

Aun no puedo para las maquinas, el cliente no lo permite. Cuando pueda ponerlo en mantenimeinto hare pruebas utilizando un solo camino para la conexion FC.

Gracias.

Os ire contando.

Reply
0 Kudos
AlvaroCo
Contributor
Contributor

Por cierto, ¿alguna manera de migrar las maquinas de ese host a los otros? aunque sea apagandolas.

Gracias.

Reply
0 Kudos
FerrerDeCouto
Commander
Commander

Hola AlvaroCo:

  1. Si tienes acceso a las VMs apágalas.
  2. Expulsa el host que falla de vCenter.
  3. Registra cada VM a través de Browse datastore haciendo clic sobre el .VMX con el botón derecho y eligiendo Add to Inventory.

Un saludo.

José Luis Gómez Ferrer de Couto Founder of PiPo e2H Blog: http://blog.e2h.net Si encuentras que esta o cualquier otra respuesta fue de utilidad, por favor da el voto. Gracias. If you find this or any other answer useful, please consider awarding points. Thank you.
Reply
0 Kudos
AlvaroCo
Contributor
Contributor

Ok gracias.

Solo puedo apagar algunas de las maquinas. Si expulso el host se veran afectadas las MV que estan funcionando en el y no tenga apagadas.

Muchas gracias.

Reply
0 Kudos
FerrerDeCouto
Commander
Commander

Hola AlvaroCo:

El que expulses el host de vCenter no conlleva que pierdas el funcionamiento de esas VMs, seguirán corriendo en ese host. Ahí sólo queda que hagas un apagado sucio del host.

Un saludo.

José Luis Gómez Ferrer de Couto Founder of PiPo e2H Blog: http://blog.e2h.net Si encuentras que esta o cualquier otra respuesta fue de utilidad, por favor da el voto. Gracias. If you find this or any other answer useful, please consider awarding points. Thank you.
Reply
0 Kudos