Saludos
mi problema es que tengo una serie de máqinas virtuales con S.O. RedHat que se cuelgan. Las VMs dejan de dar servicio y no responden por ssh. Si intentas conectarte a través de la consola muestra el login, pero no deja introducir la contraseña. Los logs de sistema de las VMs no muestran nada, la VM simplemente deja de funcionar. Curiosamente si responde a Ping. Estas son las características de las VMs:
distro | kernel | tools version |
RH3 U2 | 2.4.21.15.ELsmp | 169697 |
RH3 U2 | 2.4.21.15.ELsmp | 169697 |
RH3 U2 | 2.4.21.15.ELsmp | 158874 |
RH3 U2 | 2.4.21.15.ELsmp | No instaladas |
RH5 | 2.6.18-164.6.1.el5 | 158874 |
RH5 | 2.6.18-164.6.1.el5 | 158874 |
Estas VMs no tiene una carga de trabajo elevada. Mi sensación es que la versión de Kernel de esta versión de RedHat nos está jugando una mala pasada. Pero hay algo que añadir, tenemos otras tantas VMs con la misma distro y kernel que no han sufrido ningún cuelgue (!).
La infraestructura esta formada por 20 Hosts ESX 3.5U4(176894) en un Cluster con Vcenter 2.5 U4 y almacenamiento en San FC.
¿Alguien ha pasado por problemas similares con VMs RedHat? Desde soporte aún no me han ofrecido una solución satisfactoria, ya que de momento las recomendaciones pasan por tener las Tools a la última versión....
Saludos.
Hola,
igual no es la causa del problema pero esas MV's tienen más de una vCPU?
Las has configurado apropiadamente para que el reloj de las MV's funcione correctamente?
Lo que te comento "podría" ser la causa del cuelgue de las MV's.
Para descartar esa causa te recomiendo que sigas las recomendaciones de los siguientes documentos:
Ya contarás que tal va el tema
Saludos.
Si encuentras mi respuesta útil, considera puntuarla como correcta o útil. Muchas gracias!! -- If you found this information useful, please consider awarding points for "Correct" or "Helpful" answers/replies. Thanks!!
Hola Borja_Mari
todas las VMs tienen dos procesadores. En el cluster hay aproximadamente unas 80 máquinas linux, y con RedHat desde la RH3U2 hasta RH5. Es curioso que solo hayan fallado estos dos kernel. Tengo 13 VMs más que son similares a estas y que podrían verse afectadas por el fallo.
Estoy revisando el tema del relo, aunque yo lo descartaría, ya que por lo que veo en la KB 1007020 no debería afectar a las RH3U2, que son la mayoría de VMs que fallan.
Alguna idea más?
Gracias y saludos.
Bueno,
antes de descartar ese motivo de forma definitiva configura las MV's tal como recomiendan en el doc de best practiques
Por cierto, no te olvides de revisar los logs de las MV's a nivel del sistema del host ESX.
Igual encuentras algo interesante allí.
Saludos
Si encuentras mi respuesta útil, considera puntuarla como correcta o útil. Muchas gracias!! -- If you found this information useful, please consider awarding points for "Correct" or "Helpful" answers/replies. Thanks!!