こんにちは。
VSAN利用時(FTT1 Mirror構成)のノード障害の挙動について知りたいです。
・4ノード以上のVSAN環境(FTT1 Mirror構成)で1ノード障害が発生した場合、60分後にResyncが走ると思いますが、この処理が完了した場合は残ったノードでさらにFTT1 Mirror構成が構築され、その後さらにもう1台ノード障害が発生してもデータロストはしない、という認識で正しいでしょうか?
もし正しい場合、理論的には例えば5ノード構成の場合、障害発生で1ノード減る(残4ノード)→Resync完了→障害発生で1ノード減る(残3ノード)→Resync完了→障害発生で1ノード減る(残2ノード)→2ノードなのでResyncは実行されない・・・と2ノードになるまではデータロストはしない仕組みになっているのでしょうか?(リソース不足については考えずあくまでもデータロストするかしないか、の観点です)
・あと3ノード(FTT1 Mirror構成)から1ノード障害で2ノードになったときResyncは実行されないと思いますが、手動などで実行する手段はあるのでしょうか?
よろしくお願いします。
> ・4ノード以上のVSAN環境(FTT1 Mirror構成)で1ノード障害が発生した場合、60分後にResyncが走ると思いますが、
> この処理が完了した場合は残ったノードでさらにFTT1 Mirror構成が構築され、
> その後さらにもう1台ノード障害が発生してもデータロストはしない、という認識で正しいでしょうか?
残り 3Node の容量に Resync 分の余裕がある場合は、3Node で再度 FTT1 Mirror が構成されますので、
この状態でもう一台のノードが落ちても仮想マシンはデータアクセスが可能です。
「データロスト」に関して、厳密には落ちたノードが再起動して正常に vSAN 通信が再開されれば、
落ちたノードにしかなかったデータにも再度アクセスが可能になりますので、
例えば ESXi を再インストールした際に vSAN を構成するドライブのパーティションを飛ばすなどしない限りは「データロスト」はしません(アクセス不可状態になるのみ)。
> 2ノードになるまではデータロストはしない仕組みになっているのでしょうか?
> (リソース不足については考えずあくまでもデータロストするかしないか、の観点です)
その上で、上記質問に関しては Resync 先の容量さえ確保できて、Resync が完了していればご認識の通りです。
> ・あと3ノード(FTT1 Mirror構成)から1ノード障害で2ノードになったときResyncは実行されないと思いますが、手動などで実行する手段はあるのでしょうか?
ポリシーに準拠する台数未満の場合、ストレージポリシーで「強制プロビジョニング」を有効にしていればデプロイは可能ですが、
残念ながら Resync は必要台数未満での実施はできません。
ポリシー準拠台数未満の場合、スナップショットの操作なども制限されてしまうため、そうなる可能性がある場合は「強制プロビジョニング」を対象 VM のポリシーで有効にしておく事をお勧めします。
すべてkawaman氏が書いてくれている通りですが、もしRAIDの知識をお持ちであれば以下のイメージに近いですね。
ポリシー上必要最低限のホストでの運用 2本のハードドライブでRAID1を構成しているイメージ
ポリシー上必要最低限のホスト以上での運用 2本のハードドライブでRAID1、3本目でホットスペアを構成しているイメージ
当方vSAN/VxRailの講師を担当しておりますが、よくpooky3様と同じご質問を頂くので上記のように説明しています。
どちらでも運用が出来ますが、安心を買うのなら最低限ホスト台数ではなくそれ以上のノードがある方が良いです。
kawamanさん
ご返信ありがとうございます。
ポリシーに準拠する台数未満の場合、Resyncはできない。
どうしてもVMを作りたい場合はストレージポリシーで「強制プロビジョニング」を有効にすることで可能、ということですね。
勉強になります。
VM_Yamatoさん
ご返信ありがとうございます。
よい例をありがとうございます。
ちなみに、以下の「ポリシー上必要最低限のホスト」というのは3ノードであってますでしょうか?
推奨4ノード、最低3ノード必要、といいつつ最近2ノードVSANというのもあるようで、
結局最低限のホスト数って一般的に何台のことをいうのか混乱することがありまして。
・ポリシー上必要最低限のホストでの運用 2本のハードドライブでRAID1を構成しているイメージ
・ポリシー上必要最低限のホスト以上での運用 2本のハードドライブでRAID1、3本目でホットスペアを構成しているイメージ
はい、RAID1/FTT=1の場合はおっしゃる通り通りです。(最小台数が3台で、4台以上からオートリビルドが動作します)
以下、ご存知かもしれませんが読み物程度でご覧ください。
vSANでは、データ保護の方法としまして大きく分けて2種類あります。
前者の場合は、2n+1のルールに基づきホスト必要最小台数が決定します。nにはFTTで定義した値が入ります。
https://cormachogan.com/2014/05/15/vsan-part-25-how-many-hosts-needed-to-tolerate-failures/
後者の場合は、RAID 5なら4台、RAID 6なら6台が最小ホスト台数です。
https://cormachogan.com/2016/02/15/vsan-6-2-part-2-raid-5-and-raid-6-configurations/
それぞれの情報ソースはVMwareのCormac Hogan氏のブログより。
最小台数の説明時に以下のイメージをよく使うのですが、FTT によりそれぞれコピーデータ数より余計に ESXi が必要になるのは
一部 ESXi がネットワーク隔離状態になった際でも多数決で各 ESXi が自分自身の有効性を確認するための TieBreaker の役割をする Witness コンポーネントがデータとは別の ESXi に配置されるためです。
2Node vSAN の場合はこの Witness を専用の仮想アプライアンスとして別の管理クラスタなどに配置するため、データをミラー配置するノード自体は 2Node でも問題ないわけです。
ご参考まで、、、
VM_Yamato さん
kawaman さん
いろいろ教えていただきありがとうございました。
それぞれのメリットデメリットを整理して選定しようと思います。