LinuCレベル3 304試験の例題と解説

334.3フェイルオーバークラスタ

今回は304試験の試験範囲から「334.3 フェイルオーバークラスタ」についての例題を解いてみます。

■トピックの概要
このトピックの内容は以下の通りです。

<334.3 フェイルオーバークラスタ>
重要度 3

<説明>
Pacemakerの高度な機能に関する経験。OpenAISとcorosyncの利用を含む。

<主要な知識範囲>
・fencing
・quorum
・データの整合性
・ファイルシステムとの統合

<重要なファイル、用語、ユーティリティ>
・STONITHd
・OCFS2
・ldirectord
・softdog
・OpenAISとcorosync

■例題
STONITHの説明として正しいものを選びなさい。

1. 死活監視を行う
2. スプリットブレインを防止する
3. 監視対象が反応しなくなった時にサービスを起動する
4. 複数ノードからのアクセスを許可するストレージを構成する

※この例題は実際のLinuC試験とは異なります。


解答と解説

答えは2. スプリットブレインを防止する です。

Pacemakerでシステムを冗長構成にした時に、考慮すべき問題の1つが「スプリットブレイン」です。

死活監視をネットワーク経由で行っている場合、ネットワークの経路を複数用意します。たとえば、ネットワークインターフェース、LANケーブル、スイッチまで複数用意することで、どれか1つが故障しても、他の経路を伝って死活監視を行えるようにするためです。

しかし、サーバー自体には障害が発生していないのに、死活監視経路のみすべて通信ができなくなってしまうケースが考えられます。これがスプリットブレインです。文字通り頭が2つに分かれた状態なので、それぞれが相手が死んでしまったと考え、サービスを起動しよう(し続けよう)とします。これにより、同じIPが2つ存在する、サービスが2つ動作する、というような不都合が発生してしまいます。

スプリットブレインを防ぐには、スプリットブレインが発生した時に、どちらか片方を停止させる方法が考えられます。これを実現するのがSTONITH(Shoot The Other Node In The Head:相手の頭を打ち抜く)です。
フェンシングとも呼ばれます。

STONITHの実現方法は、IPMIなどの電源をネットワークでON/OFFする機能を用いて、スプリットブレインが発生した時に、相手のIPMIに対して電源OFFの命令を発行します。

IPMIのインターフェースは、サーバー機であれば大体備えていますが、低価格なサーバー機では備えていないこともあります。HA構成を組みたい場合には、IPMIを備えているかどうかを事前に確認しておく必要があります。

ページトップへ