x403
Contributor
Contributor

ESXi 4.1 - после перестройки RAID пропали файлы машин, место занятое ими осталось

Сначала пришлось жестко перезагрузить сервер ESXi 4.1. Далее была перестройка RAID.

ESXi 4.1 с этого же рейда запускается, но файлы и папки большинства виртуальных машин оказались ненайдены. Оставшиеся не запускаются с различными ошибками (cannot open the disk xxx.vmdk или cannot open the configuration file mail.vmx). После первого запуска в SSH и Datastore Browser иногда удавалось увидеть папки с пропавшими машинами и все файлы в них, а иногда они пропадали. Занятое ими в Datastore место осталось. После перезагрузки и доступа через SSH видна следующая картина:

1.jpg

где simatek_1, print, simatek-sql - это и есть "пропавшие" виртуалки.

Подозреваю что они остались на диске, но как их увидеть и вернуть к жизни - вот очень важный вопрос? Заранее спасибо за помощь - она очень нужна, на сервере была почти вся инфраструктура. Бэкапы пока не могу восстанавливать ибо боюсь затереть данные о машинах.

Этот топик https://communities.vmware.com/message/1219895 читал, но там не та проблема.

Tags (4)
0 Kudos
3 Replies
AlexFedosenko
Enthusiast
Enthusiast

Добрый день, страшные вещи вы рассказываете, коллега. Упаси кому-нибудь столкнуться с таким у себя в продакшене. По теме, даже не знаю что сказать, не сталкивался с таким, может быть либо контроллер чудит либо файловая система esxi побилась и нужно восстанавливать танцами с бубном. Если не было бэкапов и эти виртуалки являются бизнес критическими серверами то можно наверное выкрасть трудовую из отдела кадров и бежать без оглядки )

0 Kudos
unix111
Enthusiast
Enthusiast

Первое посмотреть что происходит с Raid Массивом  посмотреть не перегревается ли контроллер Raid
какое состояние дискового массива Должно быть Optimal

Use one of these two options to resolve this issue:

Use fsck

Use fdisk and e2fsck–p

Both of these options require that you use single user mode on the ESX host. To enter single user mode:

Reboot the ESX host.

When the GRUB screen appears, press the space bar to stop the server from automatically booting into VMware ESX.

Use the arrow keys to select Service Console only (troubleshooting mode).

Press the a key to modify the kernel arguments (boot options).

On the line presented, type a space followed by the word single, and press Enter. The server boots into single-user mode.

Using fsck to resolve this issue:

Enter single user mode on the ESX host.

Run the fsck command with these parameters:

# fsck -f -c -y

Using fdisk and e2fsck–p to resolve this issue:

Enter single user mode on the ESX host.

Verify the partition tables using this command:

# fdisk –lu

Make note of the partition information.

Unmount the partition:

# umount /dev/partition_name

Run the e2fsck–p command on the affected partition. For example:

# e2fsck–p /dev/sda1

Once the file system check is complete, reboot the host:

# init 6

0 Kudos
x403
Contributor
Contributor

Спасибо, но я так понял (https://communities.vmware.com/thread/293108), что и fsck и e2fsck не применяются для VMFS, на которой и лежат все машины, ими можно проверить только системные разделы ESX. Или я не прав?

0 Kudos