VMware Global Community
Rejaine
Contributor
Contributor

Problemas Backups x Snapshot

@

Olá pessoal,  tudo bem?

Estou com alguns problemas em relação a snapshots que demoram várias horas para serem removidos ao término do backup (utilizo o DataProtector + VEPA)

Vejam esses dois exemplos:

1 -  vm linux rodando um software de monitoramento que contém dois discos: 50G e 60G. Essa VM roda um banco de dados postgressql e um software de gerenciamento (opennms)

Ao iniciar um job de backup, apenas 5 minutos depois da criação do snap, o mesmo já está com um snap de 2.1G e outro de 4.2G.. Ao termino do backup, o comando de remoção do snapshot é executado, porém leva  várias horas (as vezes mais de 4 horas!!!) para remover esses snapshots  e a vm fica com a performance prejudicada durante todo o processo.

2) vm rodando SQL Server, com um disco de 200G. Fez um backup domingo a noite e ao término do backup e já tinha dois snaps de +- 36G cada.. Após finalizar o backup, a remoção destes snapshosts degradou absurdamente a vm e ninguem conseguiu trabalhar. Depois do procedimento de remoção ficar processando o dia inteiro,  a noite ocorreu um erro e acabou não removendo os snaps Se tento executar novamente a remoção dos snaps ele diz "Another task is alread in progress". Não consigo fazer mais nada com a máquina (não consigo clonar, mover, desligar, remover snaps, nem fazer novos backups - não sei mais o que fazer!!)

Tenho outras máquinas em que o processo é feito normalmente (backup/snap/remoção, etc) mas essas duas tem me dado dor de cabeça... Tenho um cluster Esxi 5.5 com dois servidores físicos e o storage  é HP 3Par com discos FC. As duas vms tem 8vxpu, a primeira tem  8GB a segunda 32GB de memoria..  Nem todas as máquinas virtuais apresentam esse comportamento, mas essa duas, especificamente, estão me dando dor de cabeça..

Alguma dica do que pode ser??

0 Kudos
4 Replies
Rejaine
Contributor
Contributor

Em tempo: no caso da 2a vm (do sqlserver), conectei diretamente no host esxi onde ela está ativa e percebi que a remoção do snapshot está ainda execução em 43%  (pelo vcenter não estava mostrando mais, talvez devido a algum timeout) .. ou seja, já entra no segundo dia a remoção do snap Smiley Sad

0 Kudos
diegodco31
Leadership
Leadership

Ola, isso já acontecia antes ou é um comportamento recente? Teve alguma alteração na sua infra?

Eu vi que e outro post você esta enfrentando problemas com o vcenter.

Diego Oliveira
LinkedIn: http://www.linkedin.com/in/dcodiego
0 Kudos
Rejaine
Contributor
Contributor

Olá Diego,

O problema que estava tendo com vcenter já foi praticamente resolvido (estou só fazendo mais alguns testes para confirmar)

Quanto a esse problema do snapshot nessas duas máquinas (que demora muito pra remover, mesmo não sendo tão grande assim), já está acontecendo a mais tempo . Não houve alteração na infra. Sempre noite que essas máquinas geram snaps  que demoram muitas horas pra terminar..

Por exemplo, disparei um job q faz backup de várias vm's.. Uma delas é uma linux e o snap dela foi  gerado as 14:22. O comando de remoção deste snap foi disparado as 16:50 e já são 17:27 e os snaps ainda não  foram removidos. Essa VM tem dois discos (50G e 60G) e foram  gerados dois deltas durante o período de backup: 3,7G e 1,9G respectivamente. Ele começa a remover, para em 66% e fica um tempão ai.. Da ultima vez levou 4 horas para remover esses snaps (não considero 1G ou 3G algo tão  grande assim para demorar tanto tempo assim.. se fossem uns 500G 800G, até entenderia..)

Eu queria entender se isso é normal mesmo.. se é lento assim mesmo ou se  tenho algum problema no meu ambiente, pois enquanto o snapshot está sendo removido, a máquina sofre uma degradação de performance (quanto mais tempo leva, mais reclamação tenho dos usuários)


0 Kudos
diegodco31
Leadership
Leadership

Essas duas VMs que estão demorando demais, todas elas tem banco de dados instalado.

No momento que o snapshot é criado ate o snap ser excluído a quantidade de alteração no disco é bem maior do que outra VM. Essa alteração é toda guardado no arquivo de snapshot.

Quando o processo de exclusão é realizado os snapshot são mesclados com o disco pai, por isso você esta percebendo uma demora maior em relação as outras.

Diego Oliveira
LinkedIn: http://www.linkedin.com/in/dcodiego