LinuCレベル2 202試験の例題と解説
2.13.1高可用システムの実現方式
今回はLinuCレベル2 202試験の試験範囲から「2.13.1 高可用システムの実現方式」についての例題を解いてみます。
ここでは、可用性を評価するための指標について確認しておきましょう。
例題
可用性を評価する指標として、説明の正しいものを選択してください。
- RPOは長いほどシステムが安定して稼働していると考えられる
- RTOは短いほどダウンタイムを短縮することができる
- MTTRは長いほどシステムが安定して稼働していると考えられる
- MTBFは短いほどダウンタイムを短縮することができる
※この例題は実際の試験問題とは異なります。
解答と解説
正解は、「2.RTOは短いほどダウンタイムを短縮することができる」です。
システムに障害が発生すると、提供しているサービスが停止してしまい、サービス利用者に迷惑がかかるだけでなく、損害賠償を請求されることもあります。
このようなシステム障害によるリスクを最小限にするためには、障害発生時のシステム停止時間を短くし可用性を向上させる必要があります。
可用性を向上させるには、バックアップサーバーを準備したり、機器やアプリケーションの冗長化などの対策があります。しかし、対策にはコストもかかります。
そこで、システムの稼働率や安定性など様々な評価指標を用いて、コストとリスク低減のバランスを考えてシステム構成を工夫する必要があります。
システムの稼働率を表すには、可用性がよく用いられます。可用性の評価には以下のような指標があります。
- RPO (Recovery Point Objective)
- RTO (Recovery Time Objective)
- MTBF (Mean Time Between Failure)
- MTTR (Mean Time To Repair)
それでは、選択肢を見ていきます。
1. RPOは長いほどシステムが安定して稼働していると考えられる
誤りです。
RPO(Recovery Point Objective)は、データを復旧するバックアップデータの目標復旧時点を指します。
つまり、どの時点までのデータを復元できるようにするかの目標値です。この指標をもとに、バックアップ方法や保存期間、バックアップ処理のタイミングなどを考慮します。RPOが短いほどダウンタイムを短縮することができるため、障害発生時に早く復旧することが可能となります。
このように、RPOはシステムを設計する際に可用性を考慮するために用いられる指標のひとつです。RPOとシステムが安定して稼働しているかどうかは関係ありません。
2. RTOは短いほどダウンタイムを短縮することができる
正しいです。
RTO(Recovery Time Objective)は、障害発生時にシステムを再稼働するまでの目標復旧時間を指します。
RPOと同様、RTOもシステムを設計する際に可用性を考慮するために用いられる指標のひとつです。RTOが短いということは、システムが再稼働するまでの時間が短いということになります。つまり、RPOと同様にRTOが短いほどダウンタイムを短縮することができるため、障害発生時に早く復旧することが可能となります。
よって、[2]は正解となります。
3. MTTRは長いほどシステムが安定して稼働していると考えられる
誤りです。
MTTR(Mean Time To Repair)は、システムが停止してから再稼働するまでの平均修復時間を指します。MTTRが長いほど、システム障害が発生してから復旧するまでの時間が長くかかる、ということを意味します。
4. MTBFは短いほどダウンタイムを短縮することができる
誤りです。
MTBF(Mean Time Between Failure)は、システムの平均的な連続稼働時間を指します。システム障害が発生するまでの平均的な時間ですので、MTBFは長いほどシステムが安定して稼働していると考えられます。
限られた予算の中で、できる限り高可用性のシステムを実現するには、様々な評価指標を使って考慮する必要があります。
可用性の評価方法にはどのようなものがあるのか再度確認し、覚えておきましょう。
例題作成者
株式会社デージーネット OSS研究室 橋本 知里