VxRail: 「Virtual SAN ディスク バランス」の警告の詳細と対処

VxRail: 「Virtual SAN ディスク バランス」の警告の詳細と対処

「Virtual SAN ディスク バランス」の概要

Virtual SAN(vSAN)では、各ディスクの使用率が均等であることが推奨されています。

通常、新しいVM(vmdkファイル等)がvSAN データストア上に作成される際に、各ディスクの使用率からバランスのとれた容量使用率となるように分散される形でvSAN Object(vmdkファイル等)が作成されますが、障害やvmdkファイルの拡張の不均衡などによって、vSANで使用されるDiskの容量使用率が徐々に不均等になり、閾値(30%)を超えると警告が発報され、vSANのヘルスチェック画面で「Virtual SAN ディスクバランス」の警告が表示されます。

この警告は仮想マシンの稼働やデータの可用性への影響はありませんが、容量使用率の不均衡があまりにも大きくなると、障害時のリスク増加や、パフォーマンス問題につながることがございます。

特に最大ディスク使用率が80%に達したときに、Reactiveリバランスという自動的にリバランス(データの再配置)が作動する仕組みとなっているため、予期せぬタイミングで自動リバランスが行われ、業務時間中であればパフォーマンス影響が出る可能性があります。

そのような事態を未然に防ぐため、最大分散が30%以上になったというアラームにより、業務影響のない時間帯に手動リバランスを実施したほうが良いことを知らせています。

以下が参考 KB です。

vSAN 健全性サービス - 物理ディスクの健全性 - ディスク容量 (2148593)

https://kb.vmware.com/s/article/2148593

vSAN のプロアクティブなリバランス (2152028)

https://kb.vmware.com/s/article/2152028

自動でのリバランス方法

VxRail 4.7.300以降(vSAN 6.7 U3以降)ではAutomatic Rebalanceという機能が追加され、Diskの容量使用率の不均等を検知したら自動でリバランスが実行されるという設定が可能です。

下記のKB:2149809に記載のある注意点を理解し、設定するかどうかの判断をする必要があります

vSAN "Proactive rebalance" and "Automatic Rebalance" (2149809)

https://kb.vmware.com/s/article/2149809

【設定方法に関して】

設定に関しては、下記の手順にて実施が可能です。

自動リバランスの設定

https://docs.vmware.com/jp/VMware-vSphere/6.7/com.vmware.vsphere.vsan-monitoring.doc/GUID-968C05CA-F...

VxRailクラスタ - 監視 - vSAN - サービス - 詳細オプション -編集をクリック - 自動リバランスのスライダをクリックして有効にする(緑が有効な状態) - 適用をクリック

AutomaticRebalance_1.png

AutomaticRebalance_2.png

手動でのリバランス方法

GUIを使用した手動リバランス

Reactiveリバランスは開始などの制御ができないため、vSAN Health Check時に最大分散(Maximum Variance)が30%を超えた場合にアラートを表示します。

まずは下図を参考に、vSANのヘルスチェック画面を開いてください。

1.png

Health Checkテスト名の ”クラスタ” を展開するとVirtual SAN ディスクバランスが表示されます。

警告が出ている場合、下記の”ディスクの再分散のボタン(英語だとProactive Rebalance Disks)が有効になります。

※最大分散が30%で警告が出ていない場合はボタンはグレーアウトして押せません。

2.png

ディスクの再分散ボタンを押すと下図のようなポップアップが出ますが大したことは書かれていませんのでOKをおして進めてください。

4.png

実行が完了すると下図のように最近のタスクのペインにタスクが表示されます。

リバランスの進捗に関わらず常に5%で表示されます。

5.png

GUIから手動で開始したリバランスタスクは24時間稼働したのち停止します。

“ディスクのリバランスの中止” (英語だとStop Proactive Rebalance Disks)により、手動でリバランスタスクを停止することも可能です。

6.png

手動で停止した場合は下図のようにリバランスの中止タスクが生成され、中止タスクが完了したのちにリバランスタスクが完了となり、停止します。

7.png

rvcを使用したコマンドでの手動リバランス方法

※類似文書として下記もご参照ください。

VxRail: CLIによるvSANリバランス

rvc(Ruby vSphere Console)コマンドを使用することにより詳細な実行設定が可能です。

vsan.proactive_rebalance_info vsan.proactive_rebalance といったコマンドにより操作します。

vsan.proactive_rebalance は、実行時間(-t 単位:分)1時間当たりのデータ移動量(-r 単位:MB)などのオプション指定があり運用管理に合わせて設定可能です。

例えば、 40GBを指定する場合は 40960 という値で指定を実施します。

また、GUIからの実行では最大分散が30%の閾値に収まるようにリバランスされますが、より均等にリバランスしたい場合は、30%より小さい値を指定して実行することで可能となります。

下記のコマンドの場合は、最大分散が20%以下になるように、30時間リバランスを実行し、データ移動量を1時間あたり40GBに指定する場合のコマンドとなります

vsan.proactive_rebalance -s -v 0.20 -t 108000 -r 40960 0

  • 実行例

root@vc [ ~ ]# rvc

Install the "ffi" gem for better tab completion.

Host to connect to (user@host): administrator@vsphere.local@localhost

password:

0 /

1 localhost/

>

> cd 1

/localhost> ls

0 VxRail-Datacenter (datacenter)

/localhost> cd 0

/localhost/VxRail-Datacenter> ls

0 storage/

1 computers [host]/

2 networks [network]/

3 datastores [datastore]/

4 vms [vm]/

/localhost/VxRail-Datacenter> cd 1

/localhost/VxRail-Datacenter/computers> ls

0 VxRail-Virtual-SAN-Cluster-<Cluster id>(cluster): cpu 62 GHz, memory 687 GB

/localhost/VxRail-Datacenter/computers>

/localhost/VxRail-Datacenter/computers> vsan.proactive_rebalance -s -v 0.20 -t 108000 -r 40960 0

以下のコマンドリファレンスや、このコミュニティの他の Document を参考にしていただけます。

VMware Ruby vSphere Console Command Reference for Virtual SAN

https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/products/vsan/vmware-ruby-vsphere-...

VxRail: CLIによるvSANリバランス

Virtual SAN ディスクバランスの警告を静観・抑止する場合

このセクションでは警告の発報を抑止する手順を紹介しています。

しかしながら、先に記載した通りディスクバランスに関しては自動リバランスによる予期せぬ業務影響の可能性がありますので、お勧めできません。

従いまして、最大分散や最大ディスク使用率をお客様にて確認していただき、手動リバランス実施の有無の判断をしていただくことをお勧めします。

Virtual SANディスクバランスのHealth Checkをスキップする方法

最大分散が30%以上でアラームが出ないようにする方法ですはVxRail 4.5 (vSAN 6.6, vSphere 6.5) であれば下記リンクのようなの手順にて項目をスキップできます。

VxRail 4.5(vSAN 6.6, vSphere 6.5)vSAN健全性テストの警告について

https://community.emc.com/message/1000585

しかし、VxRail 4.0では同様の手順は確認できませんでしたので、VxRail 4.0 (vSphere 6.0/vSAN 6.2) に関しては続く「アラーム定義を無効にする方法」をご検討ください。

なお、アラーム定義を無効にする方法」 はVxRail 4.5 (vSAN 6.6, vSphere 6.5)  でも使用可能です。

アラート定義を無効にする方法

VxRail 4.0 (vSphere 6.0/vSAN 6.2) ではHealth Checkを無効にすることはできませんが、アラート定義を無効にすることで、インベントリでの警告アイコンや、サマリタブでのメッセージを抑止できますのでパッと見、Cleanになります。

※この方法はVxRail 4.5 (vSAN 6.6, vSphere 6.5)  でも使用可能です。

※この方法を実施した後でも、vSAN健全性テストの項目にはディスクバランスの警告は表示されます。

まず下図を参考にVirtual SAN ディスクバランスのアラーム定義の編集ボタンを押してください。

8.png

編集ボタンを押すと編集ウインドウが出ますので、「このアラームを有効にする」のチェックを外してください。

9.png

警告メッセージを消す方法

アラーム定義の無効化や、vSAN ヘルスチェックのスキップを実施した後に、まだ警告メッセージが残存している場合は、下図を参考にクラスタの警告メッセージを確認してください。

10.png

”Virtual SAN ディスクバランス” の警告メッセージを確認したら、右クリック > 緑にリセット を選択し、メッセージを消してください。

留意事項

  • リバランス処理が完了した後も、使用率の低いディスクが1つでも存在する場合には他のディスクとの使用率の差分が閾値に達し、警告メッセージが消えない場合も想定されます。
  • リバランスに関する挙動(移動するデータの選定や完了時刻見込み、データの移動先)に関しては情報が公開されていません。

vSAN "Proactive rebalance" and "Automatic Rebalance" (2149809)

https://kb.vmware.com/s/article/2149809

Version history
Revision #:
1 of 1
Last update:
‎06-28-2019 01:06 AM
Updated by: