お世話になっております。
タイトルの通りなのですが、ESXi6.7のAll Flash構成のVSAN環境で
1ノード撤去することを考えます。内部LANは10G x2ポート構成です。
・撤去ノードをメンテナンスモードにしてリバランスを走らせてデータ移行を
すると思いますが、このリバランス時間についてどれぐらいかかるものか何らかの
検証データなどはあったりしますでしょうか?
もちろん環境によってかなり左右されると思いますので、だいたいこういう構成で
このぐらいのデータを移行するに〇時間かかります、ぐらいの粒度でも助かります。
(今回は1ノードあたり5TBぐらいのノードを撤去する予定です。)
・ノード撤去時のメンテナンスモードでのリバランスと、1ノード障害のときに
発生するリシンク(リビルド)はどちらもデータをコピーする処理だと思いますが
一般的にどちらののほうが処理が早く終わるのでしょうか?
よろしくお願いいたします。
退避データの転送速度は通常の VM の IO の状況や、
組まれているドライブの本数、インターフェースの違いによって大きく変わって来るので一概に時間がどれくらいかかるかは明言できないです。残念ながら...
データの転送はシーケンシャルで並列に流れていくので、最終的なデータの保存先であるキャパシティドライブで通常 VM の IO が多く余裕が足りない環境だと Adaptive Resync の機能で IO 制御が入って転送速度が抑えられる事があります。
特に SATA ドライブの場合は Queue Depth が少ないのでその傾向が強いかと思います。
https://core.vmware.com/resource/adaptive-resync-vsan
> ・ノード撤去時のメンテナンスモードでのリバランスと、1ノード障害のときに
> 発生するリシンク(リビルド)はどちらもデータをコピーする処理だと思いますが
> 一般的にどちらののほうが処理が早く終わるのでしょうか?
障害発生時、VM ストレージポリシーの場合はミラーされた片方のデータを読みに行くだけなので動作的には同じですが、
RAID5/6 の再構築時はパリティ計算のための読み込み・書き込みが多く走るので障害発生時の方が多くの IO が必要となります。
また、障害発生時のデータ復旧はデータの流れる向きも vSAN クラスタ全体でデータの再構築が流れますが、計画的データ退避時は 1 -> N で流れるので、退避の方が速度的には速いかと思います。
ご参考まで
退避データの転送速度は通常の VM の IO の状況や、
組まれているドライブの本数、インターフェースの違いによって大きく変わって来るので一概に時間がどれくらいかかるかは明言できないです。残念ながら...
データの転送はシーケンシャルで並列に流れていくので、最終的なデータの保存先であるキャパシティドライブで通常 VM の IO が多く余裕が足りない環境だと Adaptive Resync の機能で IO 制御が入って転送速度が抑えられる事があります。
特に SATA ドライブの場合は Queue Depth が少ないのでその傾向が強いかと思います。
https://core.vmware.com/resource/adaptive-resync-vsan
> ・ノード撤去時のメンテナンスモードでのリバランスと、1ノード障害のときに
> 発生するリシンク(リビルド)はどちらもデータをコピーする処理だと思いますが
> 一般的にどちらののほうが処理が早く終わるのでしょうか?
障害発生時、VM ストレージポリシーの場合はミラーされた片方のデータを読みに行くだけなので動作的には同じですが、
RAID5/6 の再構築時はパリティ計算のための読み込み・書き込みが多く走るので障害発生時の方が多くの IO が必要となります。
また、障害発生時のデータ復旧はデータの流れる向きも vSAN クラスタ全体でデータの再構築が流れますが、計画的データ退避時は 1 -> N で流れるので、退避の方が速度的には速いかと思います。
ご参考まで
kawamanさん
ご回答ありがとうございます。
やはり退避データ速度はその環境でテストしてみないとわからないですよね・・・
また、データ退避とリシンクの速度的には同構成だと一般的には
データ退避のほうが早いはず、ということですね。
非常に参考になりました。