VMware

This Question is Answered

9 Replies Last post: Sep 8, 2009 1:26 AM by moenster  

VMware - et par spørgsmål til netværksopsætning... posted: Sep 7, 2009 6:52 AM

Click to view boje's profile Novice 3 posts since
Mar 14, 2006
Hej

Jeg har lige et par spørgsmål omkring best practice vedr. netværksopsætning/switche i vores VMware miljø.

Vi har idag samlet service konsollen og VMotion på en virtuel switch. Sådan gør man vist de fleste steder ;)

I sidste uge lavede vores netværksafdeling en lille ændring der gjorde at det VLAN som SC/Vmotion benytter var offline i en kort periode. Det betød at alle vores VM's begyndte at lukke ned. Det var lidt overraskenede for mig må jeg erkende. Er det fordi det betragtes som et host nedbrud? Det er selvfølgelig lidt uheldigt da alle vores host i clusteret benytter det samme VLAN.
Det skal dog siges jeg selv var på ferie da det skete, så jeg har kun fået fortalt sammenhængen.

Hvordan undgår vi så dette scenarie i fremtiden? Hvis ovenstående beskrivelse er korrekt er en muligved vel at vælge "Leave powered on" under host failures istedet for default indstillingen som lukker VM's ned.
Umiddelbart syntes jeg ulemperne ved at gøre dette er minimale.. eller hva siger I?
Det kunne være cool hvis man så ovenikøbet kunne benytte forskellige VLAN, og på den måde have en failover muligved ved et VLAN "nedbrud". Jeg kan dog ikke se hvordan det skulle kunne lade sig gøre, da der så vidt jeg ved kun kan tilknyttes én IP til din service konsol .

Håber nogen kloge hovedet har lidt indspark til ovenstående... ?:| eller vil fortælle kort om hvordan jeres setup er skruet sammen.

Mvh
Thomas
Click to view A.Mikkelsen's profile Expert 544 posts since
Feb 27, 2006

Vi kører selv på samme opsæt som dig og har oplevet samme "fejl" før.
Vi har dog valgt at leve med det - det er os selv der ændre netværket.

Jeg ville ikke selv vællge "Leve Powered on"

Er der ikke noget med at man i VC 4 kan ændre den tids periode som styrer hvor længeder skal gå før HA kicker ind og lukker VM'erne ned.
Kan dog ikke lige huske hvor det er, vores test miljø er ikke oppe endnu.

If you found this or any other answer useful please consider the use of the Helpful or correct buttons to award points.

Regards
A. Mikkelsen

Click to view moenster's profile Master VMware Employees 973 posts since
May 19, 2004
Hejsa

Ja, det lyder som et tilfælde af isolation response... :(

Hvis det er et specifikt vlan men lukker ned, og det er på begge switche man uplinker til, ja så kan jeg ikke lige se andre muligheder end at have 2xSC. Normalt synes jeg ikke det er så fed en løsning, men i dette tilfælde er den vel ok.

Hvis det mere er pr. switch der lukkes ned, jå så skal du jo bare have uplinks til flere switche.

Normalt prøver HA at "snakke" med sine andre hostagenter og at pinge sin default GW, før den erklærer sig isoleret. En mulighed for at gøre HA mere robust for nedværks vedligeholdelse, er f.eks. at definere flere isolation addresses, gerne på forskellige subnets.

På vSphere 4, er det muligt at sætte HA i "maintenance mode" d.v.s. man disabler host overvågningen midlertidigt. Denne funktion er beregnet til f.eks. netværks lukkevinduer o.s.v.

M.v.h. Henrik
Click to view jjlp's profile Enthusiast 59 posts since
Dec 15, 2008


Hejsa

jeg har sat das.isolationaddress til min UPS i tilfælde af at min GW dør, desuden har jeg sat min das.failuredetectiontime op til 2 min.

Jeg ved ikke om det kan hjælpe dig

If you find this or any other information helpful or correct, please consider awarding points.

Click to view moenster's profile Master VMware Employees 973 posts since
May 19, 2004
Du kan sagtens definerer flere service konsoller på hvert sit subnet, du kan bare KUN have en default gateway. D.v.s. at de sekundære SC kun kan kommunikere indenfor deres specifikke SN, men det er jo også nok til at holde dem fri af isolation response.

/Henrik
Click to view aresp's profile Enthusiast 38 posts since
Nov 19, 2006

Hvis I ved hvornår management VLAN lukkes kan i gå ind og disable HA inden, så skulle jeg mene at I undgår at VM lukker/genstater.

mvh

Anders Riis

Click to view moenster's profile Master VMware Employees 973 posts since
May 19, 2004
Ja, det er vel en afvejning mellem følsomhed overfor netværks glitches og hvor lang tid HA må være om at genstarte VM'er efter en evt. hostfejl. Tak for info.

/Henrik
Click to view dkfbp's profile Master 607 posts since
May 31, 2007
Hejsa,

Der er flere måder at undgå det problem du har oplevet.

1. Hvis du kører på Fibre Channel storage kan du sætte isolation response til "leave powered on" (dette er ikke anbefalelsesværdigt på iSCSI). Hvis du sætter den ikke at slukke
vil du stadig få dine maskiner op og kørende i tilfælde af hardwarefejl men ikke hvis din service console bliver isoleret. Jeg har intet problem i at benytte leaver powered on og har
gjort det mange gange. Også efter jeg oplevede 150 maskiner slukke ned ved en false-positive ved netværksloop.

Hvis du insisterer på at køre med "power off" bør du lave redundans ikke kun på pNics i dine ESX servere men også på dine bagvedliggende switche. Sæt en standard switch op i
dit serverrum. Opret en ekstra vswitch og opret en ekstra service console der. Denne vswitch linker du så med et pNic til den fysiske switch som kun skal bruges til HA. Opret
derefter en ekstra das.isolationaddress2 som peger på en IP i dit HA netværk, evt switchens management ip adresse.


Best regards
Frank Brix Pedersen

Click to view moenster's profile Master VMware Employees 973 posts since
May 19, 2004
VMUG Denmark rocks!! ;)

/Henrik

VMware Beta Programs

Want to be Considered for Future Beta Programs?

Learn More

VMware Developer

Download SDKs, APIs, videos,
training, and more in the Developer community.

Learn More

Developer
Sample Code

Increase your developer productivity with VMware API sample code.

Learn More

VMworld
Sessions & Labs

Online access to the latest VMworld Sessions & Labs and online services.

Learn more

Purchase PSO Credits Online

Purchase credits to redeem training and consulting services online.

Buy Now

Community Hardware Software

View reported configurations or report your own.

Learn More

Only VMware ... Delivers Nexus 1000V

Ensure consistent, policy-based network capabilities to virtual machines across your data center.

Learn More

Communities