Salve,
sto ipotizzando la migliore strategia per gestire lo spegnimento di un cluster vmware in caso di blackout.
Dispongo di:
nr. 2 server fisici (IBM)
nr. 1 storage (IBM)
nr. 3 Ups APC SUA, di cui uno equipaggiato con AP9630 (scheda network).
In passato ho utilizzato il software apc network shutdown per gestire lo spegnimento di macchine fisiche.
Ho letto di ghetto shutdown, ho letto questo articolo: http://emea-en.apc.com/app/answers/detail/a_id/9920 , ma i miei dubbi rimangono:
1) Posso utilizzare apc network shutdown? E' un software valido e già testato da qualcuno di voi?
2) Apc NS lo installo sulle VM, sugli host o su entrambi?
3) Lo storage non prevede spegnimento, per cui credo che spegnendo gli host, in caso di hard-poweroff dello storage non dovrei avere corruzione di dati
4) ho bisogno di altro: ghetto.. ecc ecc?
Grazie a chi mi aiuterà!
Non l'ho mai provato, ma APC dovrebbe fornire anche un agente per ESX ed ESXi.
Questa può essere una strada, quel qual caso hai bisogno solo di quello.
Altrimenti puoi usare gli script che trovi su sito di William Lam e la vMA (è un virtual appliance che scarichi dal sito VMware).
Ma personalmente questa soluzione non mi piace molto, visto che sposta tutto il controllo in virtuale.
Io di solito utilizzo un server fisico (tipicamente quello di backup) con il software dell'APC e dei script personalizzati che seguono la mia logica di come spegnere le macchine virtuali (alcune, come i DC vanno spente per ultime) e dopo ovviamente spegne gli host.
Andrea
ok, alla luce di quanto scrivi potrei:
Installare e configurare apc network shutdown sui soli host.
Su ciascun host vado ad impostare le politiche di "virtual machine startup/shutdown" secondo le mie necessità (concordo su spegnere i dc per ultimi ed avviarli per primi).
La domanda però è: se l'UPS dà l'impulso di spegnimento all'host ESX, questo attenderà che tutte le VM si siano spente prima di spegnersi egli stesso?
Di solo un UPS si spegne quando raggiunge un tempo o una soglia che gli imposti.
O quando ha finito le batterie
Andrea
No, se un host fa shutdown credo proprio che le VM muoiano e parte l’HA (se c’e’)
Inviato: giovedì 14 luglio 2011 10:13
A: Tinivelli Alessandro
Oggetto: New message: "Gestione dello shutdown di un cluster"
VMware Communities<http://communities.vmware.com/index.jspa>
Gestione dello shutdown di un cluster
reply from Linoxmandy<http://communities.vmware.com/people/Linoxmandy> in Italy Area VMware User Group - View the full discussion<http://communities.vmware.com/message/1790652#1790652
basta configurarlo dentro la configurazione degli host, c'e' una voce apposita
Edoardo
riformulo meglio la domanda:
se il mio ups (arrivato ad esempio al 50% di autonomia) invia il comando di shoutdown all'host ESX,
l'host ESX attenderà di spegnere tutte le VM cosi come impostato in Configuration-> VM Startup/Shutdown?
Sì... dovrebbe attendere... ovviamente se non muore prima l'UPS
Bisogna calcolare almeno 10-20m di tempo di VM shutdown (soprattutto i DC sono molto lenti a spegnersi).
Quindi meglio iniziare lo spegnimento prima del 50% di autonomia (ma questo dipende da quanto è l'autonomia, ovviamente).
Andrea
ho installato PowerChute Network Shutdown 3.0.0 sull'host esx.
L'installazione automatica non riesce ad aprire le porte di comunicazione necessarie sul firewall esx.
allego screenshot con l'output degli errori.
Le porte che dovrebbero essere aperte sono le seguenti:
“esxcfg-firewall -o 3052,udp,in,apcups”
“esxcfg-firewall -o 3052,udp,out,apcups”
“esxcfg-firewall -o 3052,tcp,in,apcups”
“esxcfg-firewall -o 3052,tcp,out,apcups”
“esxcfg-firewall -o 6547,tcp,in,apcups”
“esxcfg-firewall –o 80,tcp,in,apcups”
“esxcfg-firewall –o 80,tcp,out,apcups”
“esxcfg-firewall –q”
Che comando posso usare per aprire le porte ed in quale "path" devo lanciarlo (root? o sotto una determinata cartella di sistema?)
risolto grazie a questa KB: http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=100380...
Note: If you receive the error bash: esxcfg-firewall: command not found, execute:
su - and press Enter to try again.
ho implementato correttamente l'agent APC Network Shutdown 3.0 sugli host esxi.
Alcuni giorni fa ho simulato un evento di blackout, ed ho potuto verificare che gli ESXI hanno spento (con guest shutdown) correttamente tutte le VM, prima di spegnere se stessi. Al riavvio, le VM non presentavano eventi di arresto imprevisto.
Inoltre, ho potuto verificare che il tempo di shutdown delle mie 10 VM e dei 2 host esxi, complessivamente impiega 6-7 minuti.