LinuCレベル2 201試験の例題と解説
2.04.5死活監視、リソース監視、運用監視ツール
LinuC 201試験の試験範囲から「2.04.5 死活監視、リソース監視、運用監視ツール」についての例題を解いてみます。
例題
リソースとその使用率変化に対する対応として、間違っているものを選択せよ。
- 突発的なCPU使用率が上昇して監視の閾値を超過したが、その直後に閾値を下回ったため、特に対応を行わなかった。
- 公開しているサービスについてキャンペーンの実施が予定されているため、リソースの使用率を確認したが、十分な空きがあったので、特に対応を行わなかった。
- システム利用者数の増加とともにディスク使用量が増加してきたため、リソース上限に達する期間予測やリソースの増強を検討した。
- システムメンテナンス実施時、事前にアナウンスしたメンテナンス開始時間になり、システムログインユーザー数が0になったのを確認してから作業を開始した。
※この例題は実際の試験問題とは異なります。
解答と解説
答えは 1.突発的なCPU使用率が上昇して監視の閾値を超過したが、その直後に閾値を下回ったため、特に対応を行わなかった。 です。
例え監視の閾値を下回ったとしても、その挙動が予期せぬものであれば、
システムのプロセス数・CPU/メモリー/ディスク使用率・ログインユーザー数・ロードアベレージなどを確認し、Syslogのログなどと照らし合わせ、事象の原因を特定する必要があります。
なお、予めシステムテストなどで原因が明確な場合は、問題はありません。
また、このようなシステムリソースの監視には、SNMPによるデータ収集・Syslogの分析・Ping(ICMP)による疎通確認などが用いられるのが一般的で、Icinga2、Nagios、collectd、MRTG、Cactiといったツールを使いグラフ化するなどして監視を行います。
各ツールの詳細については、以下のURLをご覧ください。
Collectd
https://collectd.org/
Nagios
https://www.nagios.org/
MRTG
http://www.mrtg.jp/
Cacti
https://www.cacti.net/
Icinga2
https://www.icinga.com/
例題作成者
鯨井 貴博 氏(登録インストラクター、LPI-Japanアカデミック認定校 Zeus IT Camp)