VMware Global Community
Hakozume
Contributor
Contributor
Jump to solution

VxRail20台同時再起動時の障害発生確率について

1クラスター20台のVxRailを同時にシャットダウンさせ、再起動する想定での質問です。

200VMをFTT=1で運用しており、再起動時に2台同時に起動不可前提で、本番VMとミラーVMが起動不可の2台に乗っている確率を求めたいです。

vSANのVM配置のアルゴリズムを考慮しない単純計算としては添付の画像のような式は成り立ちますでしょうか。

また、vSANのVM配置を考慮した上記確率は算出できないという認識で間違いないでしょうか。

0 Kudos
1 Solution

Accepted Solutions
kawaman
Leadership
Leadership
Jump to solution

算数苦手で確率計算なんてだいぶ久しぶりなので間違っていたらごめんなさい。

前提の 20 台のうち 2 台が立ち上がらない時、その上に VM (FTT=1, Mirror)を構成する Data, Data, Witness の3つのうち、2つが乗っているとその VM は起動できない (2重障害) となるので、

3C2 / 20C2 = 3 / 190 が、最初の障害を引く確率かと思います。

後は書かれた通りかなと

1-(1-((3C2)/(20C2)))^200

 

> また、vSANのVM配置を考慮した上記確率は算出できないという認識で間違いないでしょうか。

それぞれの VM のデータ容量、配置のバラつきによってコンポーネントの置かれ方、数が変わりますので、
机上計算通りの算出はできないものと思います。

View solution in original post

7 Replies
kawaman
Leadership
Leadership
Jump to solution

算数苦手で確率計算なんてだいぶ久しぶりなので間違っていたらごめんなさい。

前提の 20 台のうち 2 台が立ち上がらない時、その上に VM (FTT=1, Mirror)を構成する Data, Data, Witness の3つのうち、2つが乗っているとその VM は起動できない (2重障害) となるので、

3C2 / 20C2 = 3 / 190 が、最初の障害を引く確率かと思います。

後は書かれた通りかなと

1-(1-((3C2)/(20C2)))^200

 

> また、vSANのVM配置を考慮した上記確率は算出できないという認識で間違いないでしょうか。

それぞれの VM のデータ容量、配置のバラつきによってコンポーネントの置かれ方、数が変わりますので、
机上計算通りの算出はできないものと思います。

Hakozume
Contributor
Contributor
Jump to solution

ご回答誠にありがとうございます。

3C2を入れる視点が抜け落ちておりました。ありがとうございます。

 

ただ、3C2は分子ではなく分母に来るかと思ったのですがいかがでしょうか。

1/20C2が20台のうち2台が障害が発生する確率を示しており、3C2が分子に来てしまうと確率が上がってしまいます。

なので、1/(20C2×3C2)が最初の障害を引く確率になるかと考えました。

0 Kudos
kawaman
Leadership
Leadership
Jump to solution

20 台の中に、Data, Data, Witness がそれぞれ 1台、合計3台があるので組み合わせ的には 3つ (AB,AC,BC) が該当するので、ヒットする確率は上がる方の考えとなるはずです。

なので 1VM が 2重障害にあう可能性は 3/190 かな、と考えます。

Jangari
Enthusiast
Enthusiast
Jump to solution

1 VM のコンポーネント3個のうち2個が障害ホストに存在する状況から

  • 3個のコンポーネントが20台に配置される組み合わせが 20C3
  • 正常ホスト18台に1個配置される組み合わせが 18C1
  • 障害ホスト2台に2個が配置される組み合わせが 2C2

となるので、(18C1 * 2C2) / 20C3 = 3/190 の計算でもいいかなと思いました。

Hakozume
Contributor
Contributor
Jump to solution

kawamanさん、ご確認ありがとうございます。

つまり、(本番、ミラー、witness)から2つをピックする次の3通りが起動しない2台に存在した場合は該当VMは立ち上がらなくなるということでしょうか。

1通り目:"本番・ミラー"

2通り目:"本番・witness"

3通り目:"ミラー・witness"

 

2通り目と3通り目、つまり、"ミラー(or本番)・witness"が起動しない2台に存在して、本番(orミラー)が無事な場合は問題がない認識のもとで、当初の添付画像の式を作成しておりましたがこの認識が間違っていたということでしょうか。

0 Kudos
kawaman
Leadership
Leadership
Jump to solution

> "(本番、ミラー、witness)から2つをピックする次の3通りが起動しない2台に存在した場合は該当VMは立ち上がらなくなる"

FTT=1 では上記認識の通りとなり、
FTT=1 では構成する要素の1障害までは耐えられるという形となります。 

Hakozume
Contributor
Contributor
Jump to solution

Jangariさん、ご助言ありがとうございます。

ご提示の算出方法も大変参考になりました。

0 Kudos