VMware Global Community
rsicilia
Expert
Expert

Upgrade religions

Ciao a tutti, apro questo topic solo per sentire i pareri di altre persone che come me ed i miei colleghi lavorano su sistemi VMware di una certa dimensione (centinaia di Hosts, migliaia di VMs).

Il tema è la policy di upgrade, soprattutto per quanto riguarda rilasci importanti come il passaggio dalle 4.1 alle 5.0 e tra poco alla 5.1. Io appartengo al "culto dei cauti"... forse anche troppo cauti e aspettiamo anche mesi prima di portare la produzione alla nuova release. L'intervallo di solito ci è utile per prendere visione delle release notes e fare qualche test.

E ora chiedo a voi: come vi muovete? Aspettate l'update successivo? Aspettate un mese?

--

Rocco Sicilia

http://www.roccosicilia.it

Rocco Sicilia [aka: BrC] - http://www.roccosicilia.it - VTSP 4-5, VCP 4-5, vExpert 2013/2014
Reply
0 Kudos
22 Replies
Tinto1970
Commander
Commander

anche se sono "piccolo" ti rispondo lo stesso, perché in realtà la mia è comunque una situazione forse più delicata di chi ha l'onore e l'onere di gestire farm così grande, visto che produciamo 24 ore su 24 per 365 giorni l'anno e quindi un aggiornamento che va non a buon fine è un problema serio, anche perché per ristrettezze economiche (e arretratezze di mentalità, anche) non abbiamo un sistema di DR decente (pur avendo due sedi) e i cluster sono spesso usati al massimo delle loro possibilità, quindi anche perdere un solo host è un guaio serio.

La filosofia secondo me più logica è sempre quella di studiarsi bene i changelog e vedere se nella nuova release c'è qualcosa che ti serve, con quale "urgenza", e valutare in base a quello.

In pratica: nella mia sede la 4.1 u1 l'abbiamo messa a giugno 2011, e solo ad agosto 2012 siamo passati (sul cluster licenziato Advanced e non su quello Standard) alla 5.0 u1 sia perché un po' troppo preoccupati dalla questione "vRAM", sia perché effettivamente non avevamo necessità urgenti di avere le funzionalità portate dalla 5, sia per un po' di sana e umana paura di sbagliare.

Poi quando l'ho fatto ho pensato "perché non l'ho fatto prima", soprattutto perché ho guadagnato la Storage vMotion che non pensavo mi servisse così tanto.

Adesso arriva la 5.1 e il nuovo licensing mi permette di aggiornare serenamente (alla 5.0 o alla 5.1) il cluster Standard. Siccome con la 5.1 sul cluster Standard guadagno la Storage vMotion che accidentalmente mi serve perche' ho delle VM che non posso spegnere che stanno su uno storage a cui devo fare un power-cycle, penso che farò l'aggiornamento molto presto. Se non avessi questa esigenza forse aspetterei un po' di tempo.

--
Alessandro aka Tinto VCP-DCV 2023
please give me a "Kudo" if you find my answer useful
www.linkedin.com/in/tinivelli
my blog: https://www.linkedin.com/in/tinivelli/recent-activity/articles/
Reply
0 Kudos
rsicilia
Expert
Expert

Giustamente se non hai particolari esigenze aspetti il momento più opportuno.

Deduco comunque che di volta in volta fate le scelte del caso in base alla vostra esperienza e che non vi siete legati ad una policy "statica"... i vantaggi di riuscire ad avete tutto sotto controllo :winking_face:

--

Rocco Sicilia

http://www.roccosicilia.it

Rocco Sicilia [aka: BrC] - http://www.roccosicilia.it - VTSP 4-5, VCP 4-5, vExpert 2013/2014
Reply
0 Kudos
CloudZone
Enthusiast
Enthusiast

Non so se posso unirmi alla discussione vista la mia dimensione (decine di hosts e centinai di VMs) Smiley Wink ma mi piacerebbe sapere anche dopo avere deciso di passare alla versione aggiornata come vi organizzate per portarla in produzione.

Per esempio quando feci il passaggio da 4 a 5 ho avuto la fortuna di poter creare in parallelo 2 infrastrutture (diciamo cosi) una con 4 esistente e una nuova con 5. Ho incominciato a spostare le VM man mano che si liberavano gli host li formattavo totalmente mettevo su la 5 e l'inserivo sulla nuova infrastruttura.

Oggi tutto questo non è possibile e sinceramente come per Tinto1970 provocare un fermo anche di qualche minuto per me potrebbe essere un problema.

Fino a quando non trovo una reale motivazione penso di stare con la 5.

Reply
0 Kudos
rsicilia
Expert
Expert

Con il passaggio alla 5.0 la mia tecnica è stata praticamente identica. Prima la vCenter alla versione 5.0 e poi l'upgrade di "gruppi" di hosts che nel mio caso hanno pottuto a corrispondere ad interi cluster opportunamente svuotati a caldo (fortunatamente se l'hardware è coerente anche la migration da cluster a cluster funziona). Ovviamente i fermi ci sono stati per il riavvio delle VMs dovuto all'aggiornamento del vHardware, ma non sono stati massivi e li si è potuti pianificare.

Devo ancora prendere visione delle best practice per passare alla 5.1, ma credo che non ci si discosterà di molto.

Intanto vi ringrazio per aver detto la vostra, è sempre utile mettersi a confronto!

--

Rocco Sicilia

http://www.roccosicilia.it

Rocco Sicilia [aka: BrC] - http://www.roccosicilia.it - VTSP 4-5, VCP 4-5, vExpert 2013/2014
Reply
0 Kudos
Tinto1970
Commander
Commander

Per esempio quando feci il passaggio da 4 a 5 ho avuto la fortuna di poter creare in parallelo 2 infrastrutture (diciamo cosi) una con 4 esistente e una nuova con 5. Ho incominciato a spostare le VM man mano che si liberavano gli host li formattavo totalmente mettevo su la 5 e l'inserivo sulla nuova infrastruttura.

eh no, qui si vive pericolosamente: prima ho installato il nuovo vCenter 5.1u1, poi un lunedì pomeriggio ci ho portato dentro i miei 2 cluster. Il mercoledi' mattina ho iniziato l'aggiornamento alla 5.0u1 degli host di uno dei 2 cluster: fatto il primo ci ho spostato dentro qualche VM, verificato che fosse ok e ho proceduto con gli altri. L'altro cluster non l'avevo pianificato perché era già in uso l'80% della vRAM licenziata e anche perché non ci guadagnavo la SvMotion.

Il tutto mi è costato un bel po' di strizza ma zero downtime di qualsiasi genere.

--
Alessandro aka Tinto VCP-DCV 2023
please give me a "Kudo" if you find my answer useful
www.linkedin.com/in/tinivelli
my blog: https://www.linkedin.com/in/tinivelli/recent-activity/articles/
Reply
0 Kudos
rsicilia
Expert
Expert

Tinto1970 ha scritto:

Il tutto mi è costato un bel po' di strizza ma zero downtime di qualsiasi genere.

Ma hai tenuto il vHardware versione 7?

C'è chi lo fa... ma a me non piace tanto restare con il vecchio hardware...

--

Rocco Sicilia

http://www.roccosicilia.it

Rocco Sicilia [aka: BrC] - http://www.roccosicilia.it - VTSP 4-5, VCP 4-5, vExpert 2013/2014
Reply
0 Kudos
Tinto1970
Commander
Commander

Ovviamente i fermi ci sono stati per il riavvio delle VMs dovuto all'aggiornamento del vHardware, ma non sono stati massivi e li si è potuti pianificare.

io sinceramente l'aggiornamento del vHardware la trovo una cosa che paga solo in casi ben delimitati.

Il problema rimane l'aggiornamento dei Tools su Windows (su Linux non fa riavvio, almeno dalla 4.1u1 alla 5.0u1): per fortuna hanno dichiarato che una volta portati alla 5.1 gli aggiornamenti successivi anche su Windows non richiederanno più il riavvio.

Tenete presente che l'Update Manager può imporre alle VM l'aggiornamento automatico dei Tools al primo riavvio, il che significa che si può approfittare del primo riavvio per windows update per avere un solo downtime (leggeremente più lungo).

--
Alessandro aka Tinto VCP-DCV 2023
please give me a "Kudo" if you find my answer useful
www.linkedin.com/in/tinivelli
my blog: https://www.linkedin.com/in/tinivelli/recent-activity/articles/
Reply
0 Kudos
Tinto1970
Commander
Commander

ho tenuto il virtual hardware 7 anche dopo aver letto il blog di Andrea

http://vinfrastructure.it/2011/11/upgrade-path-vsphere-5/

"L’aggiornamento del virtual The virtual hardware può essere pianificato (ma solo dopo l’aggiornamento delle VMware Tools) oppure no… se le nuove funzioni del virtual hardware 8 (come più di 8 vCPU, il supporto 3D, …) non servono, allora si può semplicemente tenere il virtual hardware 7. Da notare che VUM è in grado di orchestrare sia l’aggiornamento delle VMware Tools sia quello del virtual hardware."

ricordare comunque di aggiornare *prima* i Tools.

ho invece aggiornato tutti i Datastore a VMFS-5, quasi tutti quelli più importanti rifacendoli in modo nativo.

--
Alessandro aka Tinto VCP-DCV 2023
please give me a "Kudo" if you find my answer useful
www.linkedin.com/in/tinivelli
my blog: https://www.linkedin.com/in/tinivelli/recent-activity/articles/
Reply
0 Kudos
rsicilia
Expert
Expert

Se non si hanno vincoli ovviamente si può non aggiornare il vHardware.

I miei amienti erogano servizi diversi tra cui puri IaaS, dobbiamo quindi tenerci "larghi" e poter corrispondere a necessità di upgrade di O.S. a livello guest che sono garantite solo con il costante upgrade del vHardware. Quindi per me un upgrade è un upgrade di tutte le farm e relative componenti.

--

Rocco Sicilia

http://www.roccosicilia.it

Rocco Sicilia [aka: BrC] - http://www.roccosicilia.it - VTSP 4-5, VCP 4-5, vExpert 2013/2014
Reply
0 Kudos
ldelloca
Virtuoso
Virtuoso

Ciao,

mi aggiungo a questo thread perchè mi pare interessante anche potermi confrontare con chi come Rocco ha in uso datacenter di dimensioni simili. Noi non abbiamo centinaia di hosts ma come VM ci siamo, probabilmente siamo più densi (oppure Rocco intendeva migliaia nel senso "tra 1000 e 10000").

Noi solitamente, viste proprio le dimensioni e la criticità di cosa ospitiamo, facciamo molto più banalmente dei tests: una parte del datacenter è dedicata a laboratorio, anche se ci girano server tecnicamente in produzione. Ad esempio ci girano i servers apache dove sta anche il mio blog, l'exchange aziendale e altre cose che se si fermano provocano problemi a noi e non ai clienti (e c'è sempre Santo Veeam a proteggerci Smiley Happy). Dopo una validazione di una settimana, qualsiasi aggiornamento viene installato, fosse firmware/patch/upgrade o altro, perchè i bug di sicurezza vanno tolti il prima possibile, e perchè molte funzioni che vengono aggiunte possono essere utili o a noi internamente oppure al cliente. Ad esempio, con vCloud 5.1 arriverà la possibilità per il cliente di espandere i dischi virtuali da web interface così come fare snapshots sulle sue VM, vuoi non offrire questa funzione?

Poi, ho sempre applicato gli stessi metodi ai clienti che hanno strutture presso di loro, ho sempre ritenuto che un buon sistema debba essere aggiornato, patchato e all'ultima versione possibile. Odio profondamente chi tiene in piedi strutture obsolete "perchè han sempre funzionato". I vantaggi che portano le nuove funzioni sono sempre maggiori dei pochi problemi che possono dare. Compatibilità hardware a parte, ma nel ciclo di aggiornamento noi consideriamo anche la sostituzione dei servers se a un certo punto non sono più in HCL. Ad esempio adesso gli ultimi 4 Proliant G5 che abbiamo sono scalati a diventare il mio lab personale in ufficio.

Ciao,

Luca.

Luca Dell'Oca | vExpert 2011-2012-2013-2014-2015-2016-2017, VCAP-DCD, CISSP #58353 | http://www.virtualtothecore.com | @dellock6 | http://www.linkedin.com/in/lucadelloca | If you find this post useful, please consider awarding points for "Correct" or "Helpful"
Reply
0 Kudos
Tinto1970
Commander
Commander

fra l'altro (mi riferisco alla legislazione italiana) le aziende che sono quotate in borsa devono sottoporsi al controllo delle società di revisione che verificano tutte le procedure, comprese quelle di backup&dr. Noi siamo piccoli ma quotati e ci dicono che dovremmo fare almeno 1 test all'anno di DR. Ma come lo faccio se ho solo il sistema di produzione?

--
Alessandro aka Tinto VCP-DCV 2023
please give me a "Kudo" if you find my answer useful
www.linkedin.com/in/tinivelli
my blog: https://www.linkedin.com/in/tinivelli/recent-activity/articles/
Reply
0 Kudos
rsicilia
Expert
Expert

Luca Dell'Oca ha scritto:

Ciao,

mi aggiungo a questo thread perchè mi pare interessante anche potermi confrontare con chi come Rocco ha in uso datacenter di dimensioni simili. Noi non abbiamo centinaia di hosts ma come VM ci siamo, probabilmente siamo più densi (oppure Rocco intendeva migliaia nel senso "tra 1000 e 10000").

Ottimo era priprio questo l'obbiettivo del thread, avere pareri di chi gestisce Virtua Datacenter di una certa dimensione :winking_face:

Il regime che applicate nella vostra infrastruttura si avvicina molto a quello che facciamo anche noi. Un ambiente di test su cui eseguire le prove e poi il rilascio in produzione.

Corcodo appieno anche sulla questione "rilascio nuove funzionalità", sia lato cliente che lato interno... come è cambiata la nostra vita quando è stata introdotta la storage vMotion o il DRS? :slightly_smiling_face: Probabilmente al cliente finale interessa poco, ma in termini di gestione cambiano tante cose soprattuto se si tengono in piedi servizi Business Critical su cui operano davvero tante persone.

--

Rocco Sicilia

http://www.roccosicilia.it

Rocco Sicilia [aka: BrC] - http://www.roccosicilia.it - VTSP 4-5, VCP 4-5, vExpert 2013/2014
Reply
0 Kudos
rsicilia
Expert
Expert

Tinto1970 ha scritto:

fra l'altro (mi riferisco alla legislazione italiana) le aziende che sono quotate in borsa devono sottoporsi al controllo delle società di revisione che verificano tutte le procedure, comprese quelle di backup&dr. Noi siamo piccoli ma quotati e ci dicono che dovremmo fare almeno 1 test all'anno di DR. Ma come lo faccio se ho solo il sistema di produzione?

Sistemi come SRM permettono di "testare" il tuo piano di DR ma devi anche avere il supporto lato storage.

Comunque il concetto di DR è molto ampio e non necessariamente un ripristino da DR implica il fermo della produzione. C'è chi implementa piani di DR con un "Recovery Time Objective" di molte ore. Pensa a chi deve estrarre diversi TB da nastri collocati OFFSITE.

Questo tipo di test - recovery e accensione dei sistemi ripristinati - puoi eseguirlo senza fermare i sistemi di produzione. Il tema è davvero molto ampio e meriterebbe un topic dedicato :winking_face:

--

Rocco Sicilia

http://www.roccosicilia.it

Rocco Sicilia [aka: BrC] - http://www.roccosicilia.it - VTSP 4-5, VCP 4-5, vExpert 2013/2014
Reply
0 Kudos
ldelloca
Virtuoso
Virtuoso

Tinto1970 ha scritto:

fra l'altro (mi riferisco alla legislazione italiana) le aziende che sono quotate in borsa devono sottoporsi al controllo delle società di revisione che verificano tutte le procedure, comprese quelle di backup&dr. Noi siamo piccoli ma quotati e ci dicono che dovremmo fare almeno 1 test all'anno di DR. Ma come lo faccio se ho solo il sistema di produzione?

Beh, facendo un pò di vergognosa autopubblicità, ti risponderei che i sistemi vCloud pubblici come il nostro nascono "anche" per queste esigenze. Invece di comprarti un sito DR fisico replicabile via SRM con tutti i costi capex annessi del ferro perennemente spento, compri un tenant vCloud, ci replichi le VM (e cosi hai anche dei backup remoti), e quando vuoi le accendi dentro vCloud testandole quindi su una lan separata, senza toccare la produzione.

Oltretutto, essendo la licenza vCloud per VM "accesa", in condizioni di non test paghi lo storage per i vmdk ma non i canoni di esecuzione delle VM stesse.

Ok, fine della promo....

Ciao,

Luca.

Luca Dell'Oca | vExpert 2011-2012-2013-2014-2015-2016-2017, VCAP-DCD, CISSP #58353 | http://www.virtualtothecore.com | @dellock6 | http://www.linkedin.com/in/lucadelloca | If you find this post useful, please consider awarding points for "Correct" or "Helpful"
Reply
0 Kudos
Tinto1970
Commander
Commander

Comunque il concetto di DR è molto ampio e non necessariamente un ripristino da DR implica il fermo della produzione. C'è chi implementa piani di DR con un "Recovery Time Objective" di molte ore. Pensa a chi deve estrarre diversi TB da nastri collocati OFFSITE.



Questo tipo di test - recovery e accensione dei sistemi ripristinati - puoi eseguirlo senza fermare i sistemi di produzione. Il tema è davvero molto ampio e meriterebbe un topic dedicato :winking_face:

emmm sì ma: dove ripristino i TB di nastri (che anche noi abbiamo a 100 km di distanza) se non ho il ferro su cui farlo? Smiley Wink

--
Alessandro aka Tinto VCP-DCV 2023
please give me a "Kudo" if you find my answer useful
www.linkedin.com/in/tinivelli
my blog: https://www.linkedin.com/in/tinivelli/recent-activity/articles/
Reply
0 Kudos
rsicilia
Expert
Expert

@ldelloca: trovo giusto parlare della propria esperienza anche se a qualcuno può sembrare pubblicita :winking_face:

Giustamente Luca parla di Datacenter che intrinsecamente offrono un servizio di DR. Che sia una replica in altro sito, un OFFSITE o altro, fino ad arrivare alla Business Continuity.

Chi lavora con VMware probabilemnte è abituato a tool come SRM o alle prodezze dei prodotti Veam. Noi (come altre aziende) usiamo molto SRM anche ad ausilio di chi ha una propria architettura in casa, ovvero tu hai il tuo cluster con i tuoi sistemi e li replici sul mio VDC remoto e ti gestisci tu il piano di DR. Lato mio ho l'onere di erogarti la potenza che ti serve al momento della procedura di DR.

Quindi anche se non hai ferro i modi ci sono... ovviamente bisogna considerare i coti/benefici, non escludi di costi meno mettere in piadi un serveraccio da usare per i test :winking_face:

--

Rocco Sicilia

http://www.roccosicilia.it

Rocco Sicilia [aka: BrC] - http://www.roccosicilia.it - VTSP 4-5, VCP 4-5, vExpert 2013/2014
Reply
0 Kudos
Tinto1970
Commander
Commander

è una cosa che mi frulla in testa da un po', almeno per la parte web. Per tutto il resto purtroppo siamo legati a sistemi che non hanno ancora sfiorato la virtualizzazione.

L'idea di avere un sito secondario per i siti aziendali (che sia nella nostra sede secondaria, in housing da qualche parte o in cloud) è da un po' che la butto lì ma è dura da far passare... e non sembra sia bastato il terremoto che ci ha sfiorato a far passare il concetto "se questo edificio diventasse inagibile staremmo giù per 1 mese minimo!"

--
Alessandro aka Tinto VCP-DCV 2023
please give me a "Kudo" if you find my answer useful
www.linkedin.com/in/tinivelli
my blog: https://www.linkedin.com/in/tinivelli/recent-activity/articles/
Reply
0 Kudos
ldelloca
Virtuoso
Virtuoso

Anche se stiamo andando un pò fuori dall'argomento originale: spesso, vista l'assenza di hardware, i costi di un DR su vCloud possono essere più bassi, quindi convinci i capi col semplice risparmio economico.

Per la questione tape, innanzitutto un piano di DR e soprattutto BC dovrebbe iniziare a prevedere l'abolizione dei nastri. Un conto è lo storico dei dati, e li i nastri sono imbattibili. Ma se vuoi fare DR/BC, si replica su disco proprio perchè altrimenti i tempi di RTO diventano intollerabili. E' proprio un cambio di strategia...

Luca.

Luca Dell'Oca | vExpert 2011-2012-2013-2014-2015-2016-2017, VCAP-DCD, CISSP #58353 | http://www.virtualtothecore.com | @dellock6 | http://www.linkedin.com/in/lucadelloca | If you find this post useful, please consider awarding points for "Correct" or "Helpful"
Reply
0 Kudos
rsicilia
Expert
Expert

Tinto1970 ha scritto:

è una cosa che mi frulla in testa da un po', almeno per la parte web. Per tutto il resto purtroppo siamo legati a sistemi che non hanno ancora sfiorato la virtualizzazione.

L'idea di avere un sito secondario per i siti aziendali (che sia nella nostra sede secondaria, in housing da qualche parte o in cloud) è da un po' che la butto lì ma è dura da far passare... e non sembra sia bastato il terremoto che ci ha sfiorato a far passare il concetto "se questo edificio diventasse inagibile staremmo giù per 1 mese minimo!"

Comprento la vostra situazione, chi approccia la questione DR si scontra spesso con la tematica "ma cosa vuoi che succeda?" o "si ma costa troppo". Non sempre chi ha il potere decisionale ha tutti gli strumenti per valutare bene i rischi ed i costi di un tema delicato come il potenziale "disastro".

--

Rocco Sicilia

http://www.roccosicilia.it

Rocco Sicilia [aka: BrC] - http://www.roccosicilia.it - VTSP 4-5, VCP 4-5, vExpert 2013/2014
Reply
0 Kudos