VMware Global Community
Tinto1970
Commander
Commander

Idea per un sito di DR a minor costo possibile...

Ciao, vorrei confrontarmi con voi su questa idea che mi frulla in testa:

nella nostra sede al momento abbiamo tre cluster vSphere (due da 3 uno da 4 host), uno dei quali molto carico e altri due in stato migliore, anche se uno di questi ha alcune VM importanti con un grosso ammontare di RAM.

Stiamo valutando la possibilità di avere un sito di DR su un'altra sede. Disponiamo già di un sw di backup e replica (Veeam, ma se fosse un altro non cambia il ragionamento).

Visto che oggi sono disponibili server rack che possono montare tanti hdd e tanta ram, la mia idea "risparmiosa" consiste nell'usare 2 di questi server rack come hosts ESXi con solo storage locale per far girare le VM replicate.
I vantaggi che vedo sono:

  1. evito una SAN
  2. le prestazioni sono buone
  3. concentrando tutte le VM Windows in un solo host non membro di cluster, mi basta una licenza Datacenter

Gli svantaggi sono: manca la ridondanza del cluster (ma è un DR....) e la complicazione in più di non avere un vCenter sulla sede DR (in realtà si potrebbe mettere, volendo).

Ai due host, eventualmente, si potrebbe affiancare uno storage capacitivo per tenere dei backup mensili/annuali delle VM.

Che ne pensate?

--
Alessandro aka Tinto VCP-DCV 2023 | VVSPHT 2023 | VMCE 2024 | vExpert 2024 | Veeam Legend
please give me a "Kudo" if you find my answer useful
www.linkedin.com/in/tinivelli
my blog: https://blog.tinivelli.com
Tags (1)
6 Replies
ldelloca
Virtuoso
Virtuoso

Ciao Tinto,

prima ancor di pensare all'hardware, io valuterei per prima cosa le opzioni che hai a disposizione e i costi associati.

In caso di un sito remoto come indichi, innanzitutto possiedi un secondo edificio alla distanza corretta? Ovvero abbastanza lontano da non essere influenzato dagli stessi eventi naturali o umani (ricordatevi, ci sono blackout, update andati a cattivo fine dei firmware dello storage, e cosi via, non pensate sempre a uragani, inondazioni e incendi....) ma al tempo stesso abbastanza vicino da essere raggiunto in auto se necessario?

Se si, il secondo passo è valutare la connettività tra i due siti, e quanti dati ci posso far passare quando replico i dati dalla produzione. Quale RPO desiderate? Ovvero ogni quante ore volete replicare? Definiti RPO e quantità di dati, la banda è sufficiente? O servirà aumentarla?

Se non possedete già il sito secondario, o alcune componenti come l'hardware, la connettività necessaria, o altro, valutare anche un servizio DRaaS, non ci sono capex da ammortizzare (edificio, hardware), la soluzione viene consumata invece che costruita e gestita (quindi meno carico di lavoro per il team IT) e il risultato finale spesso è simile, se la soluzione scelta è valida.

Luca

Luca Dell'Oca | vExpert 2011-2012-2013-2014-2015-2016-2017, VCAP-DCD, CISSP #58353 | http://www.virtualtothecore.com | @dellock6 | http://www.linkedin.com/in/lucadelloca | If you find this post useful, please consider awarding points for "Correct" or "Helpful"
Tinto1970
Commander
Commander

ciao e innanzitutto grazie per il contributo;

il secondo edificio (meglio, seconda sede) è a poco meno dei 100 Km in linea d'aria, però è "geologicamente" abbastanza lontano in quanto in mezzo c'è lo spartiacque appenninico.

Utilizzare un hw del tutto diverso dovrebbe anche tutelarmi rispetto agli eventi umani o bug di firmware, io pensavo.

In questa seconda sede c'è già personale produttivo e IT che potrebbe garantire la continuazione delle attività aziendali anche nel malaugurato caso che qui, insieme ai server, finissimo arrosto anche io e i miei compagni di scrivania Smiley Wink

Come connettività abbiamo già 200 Mbit/s, e onestamente l'RPO è un problema che al momento non mi pongo, e spiego perché: anche una replica di 1 mese fa delle VM più importanti sarebbe sufficiente alla continuità delle attività indispensabili.

Nelle prossime settimane prevedo di spostare "di là" un server con ESXi e 7-10 TB (a seconda di come configuro i raid sui dischi interni) di spazio, e inizare a testare sul campo se la banda è sufficiente per consentirmi di fare una replica quotidiana senza disturbare lo svolgimento delle attività normali.

--
Alessandro aka Tinto VCP-DCV 2023 | VVSPHT 2023 | VMCE 2024 | vExpert 2024 | Veeam Legend
please give me a "Kudo" if you find my answer useful
www.linkedin.com/in/tinivelli
my blog: https://blog.tinivelli.com
Reply
0 Kudos
ldelloca
Virtuoso
Virtuoso

Ok, direi che in queste condizioni il sito remoto di proprietà ha perfettamente senso.

Per le scelte, si avere hardware differente ti protegge da errori causati da versioni del software diverse, se il fatto di dover imparare a gestire due componenti diversi invece di uno solo non è un problema.

Direi che il piano che hai pensato ha perfettamente senso. Resta unicamente da gestire, al di fuori della piattaforma virtualizzata e del software di replica, il ripuntamento del dns sulle nuove macchine quando avvii il failover. Per fare questo puoi pensare di usare procedure manuali (a patto di tenere i TTL dei vari record molto bassi) oppure usare servizi dns con funzioni fi health check. Ad esempio Route53 di AWS ha le opzioni per fare i check sullo stato dei servizi e switchare ad altri record in caso di problemi, ma ci sono anche altri servizi simili che potete valutare.

Luca

Luca Dell'Oca | vExpert 2011-2012-2013-2014-2015-2016-2017, VCAP-DCD, CISSP #58353 | http://www.virtualtothecore.com | @dellock6 | http://www.linkedin.com/in/lucadelloca | If you find this post useful, please consider awarding points for "Correct" or "Helpful"
Tinto1970
Commander
Commander

per fortuna la questione ripuntamenti e reindirizzamenti mi pare che sia piuttosto semplice nella nostra situazione. intanti di servizi cruciali che sono pubblicati all'esterno non ne abbiamo (cioè ne abbiamo, ma non fanno parte di questo progetto): tutto ciò che è ipercritico è in applicazioni client server con i client tutti in rete locale.

Le due reti sono in MPLS quindi si vedono come due vlan della stessa rete locale: nella sede secondaria i client che sono nella VLAN 50 parlano con i server che sono nella sede principale sulla VLAN 10. Pensavo di creare una VLAN 100 nella sede secondaria ove fare girare le VM replicate e mettere un paio di client: questo mi dovrebbe consentire di fare una periodica accensione e verifica di tutte le repliche senza disturbare la normale operatività.

"The day after" il disastro dovrebbe bastare, nella sede secondaria, dire agli switch di core che i server non si trovano più sulla vlan 10 raggiungibile tramite i router mpls ma sulla vlan 100, direttamente connessa.

--
Alessandro aka Tinto VCP-DCV 2023 | VVSPHT 2023 | VMCE 2024 | vExpert 2024 | Veeam Legend
please give me a "Kudo" if you find my answer useful
www.linkedin.com/in/tinivelli
my blog: https://blog.tinivelli.com
Reply
0 Kudos
ldelloca
Virtuoso
Virtuoso

Per la parte di networking ci sono varie opzioni. Puoi anche pensare, se puoi portare le stesse VLAN su entrambi i siti, di evitare L3 e quindi i re-ip delle VM, che è fattibile in modo semplice su windows, ma richiede scripting su linux. Se le due reti girano a L2 non devi cambiare niente. Il contro è che ti ritrovi con un bel pò di broadcast che attraversano il link, ma con 200 MBps è un problema decisamente secondario.

Per il test di failover, che concordo VANNO fatti periodicamente, dobbiamo tornare un pò sulle specificità del prodotto usato. Veeam ti consente di usare surereplica, che è fatto proprio per queste occasioni, e ti permette di fare "fencing" delle reti in modo che la VM gemella in DR, quando accesa, non vada in conflitto con quella di produzione.

Ti consiglierei inoltre, per i servizi che lo prevedono, di avere ridondanza a livello applicativo prima ancora che infrastrutturale. Il più lampante che mi viene in mente è active directory. Leggo molti che chiedono come replicare i domain controller, ma a meno che non ci siano seri problemi di licensing, prevedi di avere due domain controller aggiuntivi nel sito secondario, già configurati e operativi. Basta usare i sites opportunamente configurati per tenere tutti i login locali al sito dove i client si trovano, ma almeno in caso di crash i due controller sono già pronti in DR.

Stesso discorso per Exchange ad esempio se usi i DAG. Per tutto il resto, repliche di Veeam e via... Smiley Happy

Luca.

Luca Dell'Oca | vExpert 2011-2012-2013-2014-2015-2016-2017, VCAP-DCD, CISSP #58353 | http://www.virtualtothecore.com | @dellock6 | http://www.linkedin.com/in/lucadelloca | If you find this post useful, please consider awarding points for "Correct" or "Helpful"
Tinto1970
Commander
Commander

Portare le stesse VLAN su entrambi i siti non penso proprio sia possibile/salutare per questioni di architettura della mpls. Vorrei comunque evitare di dover cambiare ip e indirizzamenti perché temo che sarebbero da cambiare in N posti dentro le applicazioni. Purtroppo alcune sono sviluppate internamente e qualche programmatore birichino ha il brutto vizio di cablare le configurazioni nel codice, quindi tocca ricompilare se cambi un ip  :smileycry:

Il "piano" che ho pensato dovrebbe consentirmi tutto ciò senza toccare gli indirizzamenti né nella parte server né in quella client.

Per quanto riguarda AD è già "spalmato" sulle due sedi, così come lo erano i DAG, finché c'erano.

--
Alessandro aka Tinto VCP-DCV 2023 | VVSPHT 2023 | VMCE 2024 | vExpert 2024 | Veeam Legend
please give me a "Kudo" if you find my answer useful
www.linkedin.com/in/tinivelli
my blog: https://blog.tinivelli.com
Reply
0 Kudos