では、今日も授業を始める。今日のテーマはZabbix(ザビックス)監視だ。
Zabbix監視って何?
サーバを構築して導入したら、サービス提供していくことになる。
もし、サーバがダウンしたら、サービスが停止してしまうため、
定期的にサーバをチェックして、サーバに異常が発生していないかチェックすることが監視だ。
サーバーが正常に稼働しているかどうかを監視するってことね。
監視するにも、監視するためのサーバがいるの?
うむ。例えば、RHELやCentOSなどのLinuxサーバに、監視ソフトウェアをインストールして設定すればいい。
監視ソフトウェアってどんなのがあるの!?
監視ソフトウェアはいろいろある。例えば、Zabbix(ザビックス)やNagios(ナギオス)、Hinemos(ヒネモス)、Cacti(カクティ)、Munin(ヌニン)などが有名だ。
これらはすべてOSS(オープンソースソフトウェア)で提供されている。
すごーい。
Zabbix(ザビックス)で監視する場合、監視サーバとして、Zabbixをインストールする。
監視したいサーバにも監視エージェントというソフトウェアをインストールすることで、Zabbixから監視対象のサーバを監視することができる。
Zabbixはラトビアの企業であるZabbix SIAが開発している。Zabbixの本社はラトビアにあるが、東京(日本)にも支社がある。
Zabbixはラトビア生まれってことね。Zabbixはいつからあるの!?
Zabbixはアレクセイ・ウラジシェフ氏によって1998年に開発され、2001年に公開(リリース)された。
最初のバージョン1.0(安定版)は2004年にリリースされた。
最近だと以下のバージョンがリリースされている。
Zabbix 3.0LTS 2016/2/16
Zabbix 4.0LTS 2018/10/1
Zabbix 4.4 2019/10/7
LTSって何!?
LTSはLong Term Supportのことで、LTSは長期間サポートされるバージョンだ。
LTSがつかないバージョンは、短期間しかサポートされないポイントリリースといっている。
LTSはどのくらいサポートされるの!?
Zabbix 3.0 LTSの場合、2016/2/16にリリースされ、フルサポート終了が3年後の2019/2で、
リミテッドサポート終了が5年後の2021/2だ。
Zabbix 4.0 LTSの場合は、2018/10/1にリリースされ、フルサポート終了が2021/10で、リミテッドサポート終了が2023/10だ。
LTSではないZabbix 4.4は、2019/10/7にリリースされたが、フルサポート終了が2020/3で、リミテッドサポート終了が2020/4だ。
LTSはリリースされてから5年間サポートされるのね。フルサポートとリミテッドサポートの違いは?
フルサポートは使用方法の問い合わせ、問題の原因調査、バグフィックス、機能改善要望への対応があるが、
リミテッドサポートになると、使用方法の問い合わせ、問題の原因調査、バグ修正は深刻度の高いバグのみ、セキュリティフィックスになる。
以下のZabbix公式サイトに詳細が書かれている。
https://www.zabbix.com/jp/life_cycle_and_release_policy
そ~なんだ。Zabbixって、何の言語でかかれているの?
Zabbixのバックエンド部分は、C言語で書かれていて、Web画面はPHPで書かれている。
Zabbixは監視で収集したデータは、データベース(例:MySQLやPostgreSQL)に保存される。
監視するには監視される側のサーバにZabbixエージェントをインストールする方がいいが、
Zabbixエージェントをインストールせずに、エージェントレスで監視することもできる。
しかい、エージェントレスだと、ICMPのPing監視などの簡単な監視しかできない。
エージェントをインストールした方がいろいろな監視ができるってことね。
うむ。死活監視では、Pingによる応答監視以外にポートの応答監視がある。リソース監視では、CPU使用率の監視、
メモリ使用率の監視、スワップ使用率監視、ディスク使用率監視、ロードアベレージ監視、ネットワークトラフィック監視などができる。
また、プロセス/デーモン監視では、常時動いていないといけないプロセスが停止していないか監視できる。ゾンビプロセス数の監視もできる。
ログ監視では、特定のログファイルに、特定の文字列が出力していないかを監視することができる。
例えば、/var/log/messagesファイルに、errorやwarningなどの文字列が出力されたときに監視で検知したりできる。
いろいろな観点で監視するのね。障害になる前に対処しないといけないから、少しでも異常な状態になったら、監視で検知できた方がいいってことね。
24時間365日サービスを提供しないといけないサーバもあるからな。
監視では閾値(しきいち)を設定して、その閾値を超過したら、アラームを上げるようにする。
アラームはメール通知させたり、slackへ通知したり設定することもできる。
CPU使用率の閾値(しきいち)を80%にしたら、80%を超えたら監視で検知できるってことね。
では、今日はここまで。
は~い
1.監視は機器に異常が発生していないかチェックすること
2.Zabbix、Nagios、Hinemos、Cacti、MuninはOSSの監視ソフトウェア
3.Zabbixは監視対象機器にエージェントを入れる方がよい
4.Zabbix社のラトビアの企業が開発
5.LTSはLong Term Support(長期サポート)
6.監視項目:
・Ping監視
・ポート応答監視
・プロセス監視
・ゾンビプロセス数の監視
・CPU使用率
・ロードアベレージ監視
・メモリ使用率
・ページアウト監視
・SWAP使用率
・Disk使用率監視
・iノード数の監視
・NICのパケットエラー率監視
・ログ監視
・DBリソース監視
7.Zabbixのサポートはフルサポートとリミテッドサポートがある
8.LTSは5年間サポート
9.ZabbixはC言語とPHPで書かれている