ZABBIX 監視対象の設定 のバックアップ(No.8)
- バックアップ一覧
- 差分 を表示
- 現在との差分 を表示
- ソース を表示
- ZABBIX 監視対象の設定 へ行く。
- 1 (2008-10-17 (金) 17:10:22)
- 2 (2008-10-17 (金) 17:13:55)
- 3 (2008-11-05 (水) 10:44:20)
- 4 (2009-01-29 (木) 11:17:51)
- 5 (2009-01-30 (金) 11:26:37)
- 6 (2009-02-22 (日) 14:58:21)
- 7 (2009-03-12 (木) 10:56:30)
- 8 (2009-04-02 (木) 17:45:59)
- 9 (2009-04-03 (金) 00:52:27)
- 10 (2009-04-03 (金) 09:49:28)
- 11 (2009-05-08 (金) 02:00:26)
- 12 (2009-05-20 (水) 16:17:44)
- 13 (2009-08-19 (水) 14:58:02)
- 14 (2009-09-10 (木) 16:10:11)
- 15 (2009-11-03 (火) 15:56:15)
*目次 [#rbc94a8d]
アイテム設定(値取得) †
ping監視 †
fping設定 †
ZABBIXのping監視はfpingを使用する。
RPMパッケージでfpingを導入後、root以外のユーザからfpingを実行できるようにパーミッションを変更する。
chmod 755 /usr/sbin/fping
ping監視の実行間隔 †
WebUIからの実行間隔設定は無視されるため、ZABBIXサーバの設定ファイル(/etc/zabbix/zabbix_server.conf)の以下の設定で実行秒数を指定する。
PingerFrequency = 60
ping監視用トリガー設定 †
- 5分間(300秒)で4回エラーが発生した場合にエラーとして検知する。
書式 {%HOST%:icmpping.count(300,1)}=4
特定のポートを監視する †
アイテム設定にて以下の要領で設定を行う。
- ポート監視
タイプ ZABBIXエージェント キー net.tcp.service[<Protocol>,<IP Address>,<Port>] データ型 数値(整数)
キーの必須項目は<Protocol>のみで、他は必要に応じて設定を行う。
- 例(NTP)
net.tcp.service[udp,,123]
- 例(SWAT)
net.tcp.service[tcp,,901]
- 例(VMware-MUI)
net.tcp.service[tcp,,8333]
Windowsのイベントログ監視 †
イベントログはエージェントのアクティブチェック機能を使用する。
日本語対応はいまいちな模様(1.4系)
アイテム設定 †
- システム
タイプ ZABBIXエージェント(アクティブ) キー eventlog[system,,cp932] データ型 ログ
- アプリケーション
タイプ ZABBIXエージェント(アクティブ) キー eventlog[application,,cp932] データ型 ログ
- セキュリティ
タイプ ZABBIXエージェント(アクティブ) キー eventlog[security,,cp932] データ型 ログ
トリガー設定 †
トリガーには以下の項目が設定可能
- ログの出力元アプリケーションを指定
書式 {%HOST%:eventlog[system].logsource(文字列)}=判定 判定 1=文字列にマッチする 0=文字列にマッチしない
- ログ内の文字列を指定
書式 {%HOST%:eventlog[system].iregexp(文字列)}=判定 判定 1=文字列にマッチする 0=文字列にマッチしない
- ログ内の深刻度(重要度)を指定
書式 {%HOST%:eventlog[system].logseverity()}=判定 判定 0= 1= 2= 3= 4=
参考 †
http://www.zabbix.com/wiki/doku.php?id=howto:monitoringwindows
リソース監視 †
CPU負荷の監視 †
CPU負荷監視はOSにより設定と取得可能項目が異なる。
- Windows
コア単位でのCPU負荷を取得(初期状態では最大8コアまで監視可能)
CPU(コア)の番号は0〜nとなる。タイプ ZABBIXエージェント キー system.cpu.util[<cpu(core No.)>,,<mode>] データ 数値(浮動少数) - CPU1(コア1)の負荷を取得する場合の設定
system.cpu.util[0,,]
- Solaris
システム全体のidle率を取得(コア単位の値取得は不可)タイプ ZABBIXエージェント キー system.cpu.util[,idle,<mode>] データ 数値(浮動少数)
- 5分平均のidle率を取得する場合設定
system.cpu.util[idle,avg5]
- Linux
システム全体のidle率を取得(コア単位の値取得は不可)タイプ ZABBIXエージェント キー system.cpu.util[,idle,<mode>] データ 数値(浮動少数)
- 1分平均のidle率を取得する場合設定
system.cpu.util[,idle,avg1]
ネットワーク機器の監視 †
通常はSNMPv1もしくはSNMPv2のテンプレートを使用する。
テンプレートには50ポート分の設定があらかじめ組み込まれているため、通常はこれで間に合うと思われる。
テンプレートを使用する場合の注意点は以下。
トラフィックの監視 †
なぜか初期設定ではトラフィックの実数を取得する設定となっている。
bps単位での取得が必要となるため、以下の設定を行う。
(一項目ずつ変更するのはしんどいため、「一括更新(mass update)」を使用すると良い)
項目名(英) | 項目名(日) | 値(英) | 値(日) |
Type of information | データ型 | Numeric(float) | 数値(浮動少数) |
Units | 単位 | bps | bps |
Use multiplier | 乗数を使用 | Custom multiplier | 乗数 |
Custom multiplier | 乗数 | 8 | 8 |
Store value | 保存時の計算 | Delta(speed per second) | 差分/時間 |
監視データの保存期間 †
監視データはヒストリとトレンドの2種類が保管される。
各データの保存期間は初期設定では以下となっている。
ヒストリ(生データ):7日 トレンド(統計データ):365日
アクション †
リモートコマンド設定 †
障害発生時に自動実行させるコマンドの設定。
設定はzabbix-agend、sudo、zabbixサーバの三箇所に行う。
Agent側の設定 †
- リモートコマンドの有効化
初期設定状態ではリモートコマンド機能は無効に設定されている。
/etc/zabbix/zabbix-agent.confの下記行のコメントアウトを外すことで、リモートコマンドを有効化できる。EnableRemoteCommands=1
設定を反映させるため、zabbix-agentdを再起動する。/etc/init.d/zabbix-agentd restart
- sudoの設定
zabbix-agentdの実行ユーザにてコマンドを実行できるようにsudoの設定を行う。
# visudo
実行するコマンドに合わせて以下の設定を行う。zabbix localhost=(root) NOPASSWD:/etc/init.d/sshd # sshの起動・停止を行う場合 zabbix localhost=(root) NOPASSWD:/etc/init.d/vsftpd # vsftpの起動・停止を行う場合 zabbix localhost=(root) NOPASSWD:/etc/init.d/apachectl # apacheの起動・停止を行う場合
ZABBIXサーバ側の設定 †
ZABBIXサーバのWebインターフェイスから以下の設定を行う。
管理アカウントにてログイン後、[設定]→[アクション]を開き、[アクションの作成]を押す。
[名前]:任意の名称を設定 [イベントソース]:トリガーを設定 [計算タイプ]:コンディションの演算子指定(and/or、or、and) [コンディション]:動作条件の設定(*後述) [オペレーション]:動作内容の設定(*後述) [ステータス]:アクションの有効/無効
- コンディション設定
サービスの再起動を行う場合は以下のコンディションを設定する。(sshd停止時に再起動する場合)
トリガー = "Sshd is not running on Host" トリガーの深刻度 = "軽度の障害"
- オペレーション設定
サービス起動コマンドの指定は以下の書式にて行う。
[HOST]:sudo /etc/init.d/sshd start
ZABBIX 1.4では空白を含むホスト名を指定するとエラーとなる。(2008.11.05)