VMware vStorage APIs for Data Protection で仮想OSなどをバックアップした場合の圧縮率をざっくり知りたいのですが、何か良いサイトなどはありますでしょうか?
vStorage APIs for Data Protection (VADP) 自体は、バックアップソフトウェアとの連携のための API ですので、VADP 機能そのもので圧縮・重複排除されるというものではないです。
※ OVA・OVF に出力する際にVMDKの空き領域が削減・圧縮される程度の動きはあると思います。
実際にデータを圧縮・重複排除する機能はバックアップソフトウェアや、バックアップデータを保管するストレージ側で提供されています。
また、その際の圧縮率、重複排除率もソフトウェア・ストレージ毎にアルゴリズムが異なりデータ削減率も変わりますし、保存されているデータのタイプによっても異なるので、ざっくりした「率」が一番難しい数字になります。
※ZIPファイルや動画や画像など圧縮済みのデータ、暗号化されたデータなどでは圧縮・重複排除は効き難い
バックアップソフトウェア各社の圧縮率、重複排除率などで公表されているものを参照するのが良いかと考えます。
ご参考まで。
vStorage APIs for Data Protection (VADP) 自体は、バックアップソフトウェアとの連携のための API ですので、VADP 機能そのもので圧縮・重複排除されるというものではないです。
※ OVA・OVF に出力する際にVMDKの空き領域が削減・圧縮される程度の動きはあると思います。
実際にデータを圧縮・重複排除する機能はバックアップソフトウェアや、バックアップデータを保管するストレージ側で提供されています。
また、その際の圧縮率、重複排除率もソフトウェア・ストレージ毎にアルゴリズムが異なりデータ削減率も変わりますし、保存されているデータのタイプによっても異なるので、ざっくりした「率」が一番難しい数字になります。
※ZIPファイルや動画や画像など圧縮済みのデータ、暗号化されたデータなどでは圧縮・重複排除は効き難い
バックアップソフトウェア各社の圧縮率、重複排除率などで公表されているものを参照するのが良いかと考えます。
ご参考まで。
ありがとうございます。
たいへん参考になりました。
Horizonとの連携を想定していました。確かにファイル依存で圧縮率が変わりますよね。
重複排除は特にVDIなどに対して有効だと思っていますが、ざっくりな質問で恐縮ですが、一般的にVDIのバックアップには重複排除や圧縮などストレージ容量効率化機能をスケジュールして使用するケースはよくあることなのでしょうか?
なぜこの質問をしたかというと、VDIバックアップ格納用ストレージ(NetAppのSVM)に重複排除を適用するかどうかを迷っているからです。
VDI 環境のデータバックアップは色々と環境・構成に依存する部分が多いので一概には言えないのですが、
注意しておいた方が良い点として以下の点は押さえておいてください。
ユーザープロファイル、ユーザーデータが NAS 上に保存されているのであれば、NAS の機能を利用してバックアップ(クローンやレプリケーション)を取得したり、
バックアップソフトウェアでデータを別媒体に取得する事が多いです。
※リンククローン環境からバックアップソフトウェアのクライアントエージェントを利用したバックアップに対応した製品も幾つかありますので、この辺りは製品メーカー様に確認するのが良いかと思います。
私個人の経験では、NetApp上にバックアップデータをバックアップソフトを経由して格納していた構成の経験はありませんが、
DataDomain や NBU などバックアップ専用の重複排除ストレージにデータを格納した構成は多数経験があります。
一般的なVDI(Office系データメイン)であれば、重複排除率はそこそこ高い傾向があると思いますので、容量削減のためには重複排除機能は有効かと思います。
※ 重複排除ストレージを利用する場合は、バックアップソフトウェア側の機能で重複排除を有効にせず、ストレージ側の機能でのみ重複排除・圧縮(またはストレージ側のプラグイン連携で対応)するようにして下さい。
二重に重複排除、圧縮を掛けると重複排除効率・性能が悪化しますので要注意です。
ご参考まで
ありがとうございます。たいへん参考になりました。 なかな有効な情報が無かったのですが、3年分くらいの経験知を頂きました。
すぐに設計に反映します。
今後ともよろしくお願いします。