salve,
ho tre macchine VMWARE Exsi 5.0.0 su DELL R610 collegate in cluster ad uno storage Iscsi AX4-5i con due disk pool in RAID5 su cui ho creato 9 LUN.
tutte le LUN sono da 400GB tranne quella incriminata che è da 800GB
Per esigenze di spazio ho dovuto spostare la macchina di posta sulla LUN da 800GB. da li sono iniziati i problemi perchè le performance , sopratutto in scrittura sono precipitate inesorabilmente. spostandola su altra LUN il problema svanisce ma lo spazio a disposizione e appena sufficiente e non mi è possibile espandere ulteriormente i dischi.
la LUN in questione fà parte del primo dei disk pool.
Grazie per info e suggerimenti
Mauro
Ultimo check e poi tolgo l'attenzione dallo storage ![]()
Riesci a postare le latency (read e write) del vDisk e del Datastore (guardando nei grafici di performance della VM) sia in presenza che in assenza del problema?
--
Rocco Sicilia
ciao,
non ho molta dimestichezza , ma non credo mi sia possibile postare quelle precedenti al problema perchè dovrei rispostarla
ho provato con quella attuale ma non mi dà il valore highest latency , ma solo i valori di read-write in tempo reale che sono 5981 e 901 kbps
Se vai nelle "Chart Options" puoi selezionare i dati che vuoi dadere ed il periodo di tempo interessato (ovviamente più vai indiatro e meno è gramulare il dato). Qui troverai anche la latency di Disk e Datastore.
--
Rocco Sicilia
la latenza del disco della VM è stata nelle ultime 6 ore mediamente di 36 millisencondi , con un picco a 301 durante il suo spostamento su altra lun
dello storage non sono riuscito ad ottenere dati in tal senso
Non è poco ma non è neanche tanto, difficile che 36 ms diano problemi seri alle applicazioni.... a questo punto ti chiedo il sintomo: cosa vedi che non va? Da quali comportamenti hai registrato performance degradate?
--
Rocco Sicilia
la macchina è un proxy server
la latenza media registrata su 6 ore , attualmente invece viaggia sui 10 in real time
in primis i sintomi sono stati che la navigazione su internet era lentissima ( cosa che non avveniva senza proxy )
anche la gestione della macchina era lenta , come aprire event viewer e vari applicativi
con lo spostamento su altra LUN l'allarme è rientrato
quello che mi fà strano è che le altre due macchine non soffrono di rallentamenti , neanche quando era presente il proxy
Che giallo ![]()
Leggevo che stai usando iSCSI... la LUN su cui si presenta il problema è presentata sullo stesso TARGET (fisico) della LUN su cui il problema non si presenta?
Proxy con MS Windows? Se è TMG occhio ai requirement, è un succhia risorse in certe situazioni.
Anche la navigazione è lenta e giustamente sospetti che sia il proxy ad introdurre la latenza... le NIC (fisiche quindi) che usi per la parte di storage sono differenti da quelle che usi per il traffico dati delle VMs? (è una banalità ma a questo punto vale la pena vagliare ogni possibilità)
--
Rocco Sicilia
no . la lun in cui si trova è su un'altro disk pool
per il traffico storage usiamo l'ISCSI che usa due schede fisiche differenti (sia per unit A che per unit B ) e che si trova su una rete a parte
Ho finito le idee per aiutarti nella diagnosi "remota".
A questo punto io mi butterei sui LOG (e via ore...)
--
Rocco Sicilia
ho scoperto che solo per una unità l'ISCSI era su rete a parte.![]()
l'altra lavora sulla stessa lan delle VMs. Ora procederò a spostare anche questa su rete separata e poi ricontrollerò se il problema rientra.
Eccola... ti auguro che il problema sia li ![]()
--
Rocco Sicilia
Aggiornamento :
Nelle settimane scorse ho proceduto a :
Creare su due distinti switch le VLAN per l'ISCSI
Indirizzarli con due classi di IP differenti
Modifica della management togliendo il collegamento ad iscsi e mettendo il Vmotion
Risultato :
Le performance sono peggiorate ![]()
Adesso ho una Lun che continua a darmi seri problemi di latenza sul disco e sembra che per alcune macchine è precipitata la velocità nel creare gli snapshot.
La cosa strana è che comunque le latenze sui dischi sembrano nella norma per dei dischi SATA I , attorno ai 27-30 ms
in questo momento c'è uno snapshot della posta andato male che stà rallentando tutto e sono in attesa della sua chisura per vedere le la situazione migliora.
