VMware Global Community
Kyvmman
Contributor
Contributor

VMware vCenter Server HeatBeat 6.5 のインストールとフェイルオーバー

新規投稿させて頂きます。

VMware HeatBeat 6.5 を使用し、2 台の"物理サーバ" で冗長構成を組みたいのですが、

Secondary サーバへ フェイルオーバーさせた際に、vCenter Server サービスが起動せず、タイムアウトとなります。

vpxd.log を見ると、何やら SSL 証明書が作れない為、エラー  との内容となってます:smileyshocked:

2013-04-10T10:31:33.411+09:00 [01964 error '[SSO][SsoFactory_CreateFacade]'] Unable to create SSO facade: vmodl.fault.SystemError.


2013-04-10T10:31:33.411+09:00 [01964 error 'vpxdvpxdMain'] [Vpxd::ServerApp::Init] Init failed: Vpx::Common::Sso::SsoFactory_CreateFacade(sslContext, ssoFacadeConstPtr)

ちなみに、検証では 2 台の仮想サーバでの 冗長構成 および HA は問題なくできることを確認してます。

物理サーバでは、何回やっても失敗します:smileycry:

当方の環境ですが、

-------------------------------------------

WorkGroup環境

hosts ファイルで名前解決

-------------------------------------------

物理と仮想サーバで、vCenter Server 、Single Sigh on 、HeatBeat のインストールで、同じやり方なので、何故 物理だけ ?と

悩んでおります。ちなみに Secondary サーバが 物理か仮想 によって、インストールウィザードでの選択箇所を変えるシーンがあるので

必ずしも、まったく同じではないですが。。

VMware HeatBeat 6.5 を使用し、物理サーバ 2 台で HA 構成が正常に行えた方がいらしたら

アドバイスを頂けると嬉しいです。

宜しくお願い致します。

Reply
0 Kudos
11 Replies
myamamoto
Expert
Expert

こんにちは。

実機で確認したわけでは無いのであくまで参考意見となりますが、

ご存知のように、セカンダリサーバ物理の場合と仮想の場合とで手順が異なります。

https://www.vmware.com/support/pubs/heartbeat_pubs.html

すみません、OSのバージョンが記載されていなかったので具体的にマニュアルの項目を確認できていないのですが...

はっきりと言えるのは、物理構成の場合H/Wの構成が同じである必要があったと思います。

記載されているログは、SSOサーバのエラーで起動していないように読み取れるのですが、VIPと各ノードのIPアドレスの関係ってどのようになっていますか?

Reply
0 Kudos
Kyvmman
Contributor
Contributor

こんにちはSmiley Happy

返信ありがとうございます。

はい。こちらの手順書を確認しております。

>>

実機で確認したわけでは無いのであくまで参考意見となりますが、

ご存知のように、セカンダリサーバ物理の場合と仮想の場合とで手順が異なります。

https://www.vmware.com/support/pubs/heartbeat_pubs.html

>>

OSは、Windows Server 2008 R2 SP 1 を使用しています。

2 台とも HW構成は同一となっております。

2 台の hosts ファイルで以下を定義しております。

----------------------------------------------------------------

hosts ファイル定義

仮想 IP                              ホスト0(仮想ホスト名)   

ホスト1 ManagementIP (1 号機ホスト名)

ホスト2 ManagementIP (2 号機ホスト名)

---------------------------------------------------------------

マニュアルの中に登場する "PublicName"が、上記 仮想ホスト名に該当します。

実機での動作を見ると、フェイルオーバー後、Active 系となったサーバのみが、仮想 IP をもつ 動きとなります。

データおよびファイルを全てレプリケーションする仕様になっているので、1 号機→ 2 号機へレプリケーションとなります。

2 号機が Active になった時、認証処理等で 1 号機の情報を使って動作することから、細かい部分で 本来 2 号機固有情報を使用しないと

いけないのに、1 号機の情報を使うことからエラーになっているのでは ? と見ております。が、検証 環境(仮想)は特別 何もしてないのにできているから

...この見解と矛盾した結果になっておりますが:smileyshocked::smileyshocked:

-

Reply
0 Kudos
myamamoto
Expert
Expert

こんにちは。

過去に似たような現象について聞いたことがあったのでその時のKBは下記になります。

http://kb.vmware.com/kb/2036170

SSOのパスワードが定義されていないときにHeartbeatによる変更で起動しなくて、それが原因でvCenterそのものが起動できないものです。

ワークアラウンドのコマンドはActiveなほうのインスタンスで実行する形になります。

再確認ですが、SSO-vCenter-DB全部1台に含まれている構成が2台あるということですよね?

SSOだけ切り出してHeartbeat外にしてSSOのHA構成にすることもできるので、その場合はこの現象は発生しない可能性が大きいのです。

Reply
0 Kudos
Kyvmman
Contributor
Contributor

こんにちはSmiley Happy 返信ありがとうございます。

はい。以下の構成です。全部 1 台に含まれている構成が 2 台となっています。(物理サーバ)

>>

再確認ですが、SSO-vCenter-DB全部1台に含まれている構成が2台あるということですよね?

SSOだけ切り出してHeartbeat外にしてSSOのHA構成にすることもできるので、その場合はこの現象は発生しない可能性が大きいのです。

>>

教えて頂きました、以下の情報も確認しましたSmiley Happy

http://kb.vmware.com/kb/2036170

こちらですが、Primary で実行して、HA してみても、Secondary で vCenter Server サービスが起動しません:smileyshocked:

そこで、Active になった、Secondary で 上記コマンドを実行し、SSO パスワードを再設定?し、Single Sign On サービスを

再起動し、手動で vCenter Server サービスが起動できることを確認しました。

しかし、再び Primary へ HA すると、今度は、Primary が vCenter Server サービスを起動できなくなります。。

Primary 側で、同じ対応をすると、vCenter Server サービスは起動できます。しかし HA すると.... の状況からは脱出できない状態です。

結局 レプリケーションされるから、不具合となるのでしょうかね。。

どこかの DB 情報の中に、SSO サーバと通信するのに必要な情報があり、そこに、Primary サーバ固有の設定が入っているから

2 号機にレプリケーションされた時に、2 号機でその情報を使用して、SSO サーバと通信するから 認証失敗等になるのかなぁと思ってます。

以前の HeatBeat は、1 台ずつ 個別にインストールするタイプで、非常に簡単だったとのことですSmiley Sad

6.5 では、インストールの途中で、1 号機の システムバックアップを取る処理が走り、2 号機側でのインストール時にその情報を使用して

リストアする.... ここで既におかしくなっているんじゃないかと思ってます:smileycry:

Reply
0 Kudos
myamamoto
Expert
Expert

こんにちは。

どこかでちらっと読んできた情報なのですが、SSOも同居している場合にはスイッチオーバー毎にこのコマンドを発行する形になるみたいですね。

ですので、おっしゃるとおりの動作なのかなと...

KBにあるコマンドはActiveな方でのみ動作するコマンドなので、FailOverする都度Activeな方の情報がコピーされたPassiveの方のSSOで不整合が起きるということが推察されます。

ただ、仮想環境の時には発生しないということなので、物理特有の問題なのかもしれませんね。

お力になれなくてすみません。

Reply
0 Kudos
Kyvmman
Contributor
Contributor

こんにちはSmiley Happy

貴重な情報ありがとうございます!!!

1 台に全て同居の構成で、かつ、物理サーバの場合は、直面している動作になるというなら、

製品仕様(バグ?) なんでしょうかね:smileycry:

こちらの情報が VMware 社、または 他のサイトにあれば嬉しいのですが、ご存知ないでしょうか ??

Reply
0 Kudos
myamamoto
Expert
Expert

サポート経由でエスカレーションしてみてはいかがでしょうか?

今の段階では、この現象について言及しているKBは私には見つけられませんでした。

Kyvmman
Contributor
Contributor

はいSmiley Happy サポート経由で確認してみます。

アドバイス等 ありがとうございました!! Smiley Happy

Reply
0 Kudos
myamamoto
Expert
Expert

こんにちは。

ご存知だと良いのですが、vCHB 6.5 Update1が先日リリースされており本件も解決されていると思います。

Reply
0 Kudos
Kyvmman
Contributor
Contributor

こんばんはSmiley Happy

本件について、アドバイスありがとうございますSmiley Wink

その後、サポートに問い合わせたところ、社内でも似たような事象が報告されているとのことで、

SSO 関連のコマンドを記述したバッチファイルを用意し、それを

vCenter HeatBeat の GUI 設定画面の中にあるタスク設定画面で、vCenter Server Single Sign On サービスの前に

動作するように仕込んでくださいとのことでした。

ただ、回答が来る前に、当方側でも

以下のコマンドを記述したバッチファイルを用意し、vCenter HeatBeat の GUI 設定画面の中にあるタスク設定画面で

vCenter Server Single Sign On サービスの前に、本バッチファイルが実行されるように仕込んだところ、2 号機へ HA 後、

vCenter Server サービスが起動され、2 号機が Active になっても無事 サービスを提供できる正常な構成となりましたSmiley Wink

■ コマンド

rsautil manage-secrets -a recover -m <masterPassword>


ということで、現状は 1、2 号機で vCenter HeatBeat の GUI 設定画面の中にあるタスク設定に

本バッチファイルを仕込んでいます。


vCHB 6.5 Update1 の件ですが、サポートに今回の修正で HA 後に SSO 関連のコマンドを実行する必要がないような

修正がされているか と確認したところ、今回の修正には含まれていないとのことでした:smileyshocked:


このため、例のタスク登録にバッチファイルを登録する  の現状構成のままとなっています。


物理環境で HeatBeat 6.5 を使用するのは、色々 不具合があるので、当方側で 色々検証中です:smileycry:



Reply
0 Kudos
myamamoto
Expert
Expert

こんにちは。

情報提供ありがとうございます。

失礼しました。5.1対応でいろいろと修正が入っていたそうなのでもしやと思ったのですが、今回の現象は含まれていなかったということですね。

SSOのマスターパスワードをバッチに入れ込むって結構セキュリティ的にはよろしくない回避策にも見受けられますが、動作しないのよりはましというところでしょうか。

引き続き、何か情報があればシェアをお願いします。

Reply
0 Kudos