nagios

データセンター増設の時にオープンソースの運用ツールがスケールするかを確認してみた

データセンターが増えるときに運用ツール側で運用変更が発生するかをまとめてみた。オープンソースだけなので、あくまで代表的な機能だけだが、、 orzオープンソースの運用ツール群は、ざっくり PNBCG-LAMP (LAMPは今回対象外)としてまとめてみた。なお、デ…

CentOS5.4へのホストOS移行について

現在KVMのホストOSには、少々古くなってきたFedora10を使用しているのだが、CentOS5.4が出たタイミングでホストOSを切り替えてもよいように思う。同時に現在ホストOS上にGanglia, Puppet, Nagios のサーバーが載っているのだが、ホストOSそのものの移行を考…

nagiosのpassive checkとrsyslogを組み合わせてみた(3)

名前付きパイプの使い方について書こうと思ったのだが、先に結果のPythonスクリプト(rsyslogfifo.py)を貼っておく。使い方としては、あらかじめ /tmp/aaa にmkfifo コマンドを実施しておく必要がある。( /tmp/aaa 経由でrsyslogからrsyslogfifo.py へのログ…

Nagiosのpassive checkとrsyslogとSNMPTrapを組み合わせてみた

前回までに、rsyslogとNagsioを組み合わせる方法について書いていたのだが、合わせてSNMPTrapを受け付ける方法についても書いておく。SNMPTrapでは通常のSNMP要求とは異なり、SNMPマネージャーからGETなどの要求を受けて、値を返すのではなく、事象が起こっ…

Nagiosのpassive checkとrsyslogを組み合わせてみた(1)

以前rsyslogとNagiosを使ったログチェックの方法として、PostgreSQLを使って定期的にログの中身をチェックする方法を作っていたのだが、( http://d.hatena.ne.jp/aaabbb_200904/20090710/1247242209 ) 他の方法を模索していたところ、 Nagiosの監視方法とし…

Nagiosのpassive checkとrsyslogを組み合わせてみた(2)

前回で、Nagios に対して、アラート通知を行う方法を書いたので、今回は、rsyslog の内容をNagios のアラート形式に書き換える方法について書いていく。Nagios の理解できる形式は、次のようなものになる。 echo "[$(date +%s)] PROCESS_SERVICE_CHECK_RESUL…

Fedoraでの統合システム運用について整理してみた

前回までに何度か統合システム運用に属するパッケージについて書いてきたが、ここで、Fedora11までの現状についてまとめてみようと思う。なお、ここでいう統合システム運用は、多数のサーバーを楽に管理するパッケージのことで、 1. 監視(ネットワーク、サー…

Nagiosとrsyslog-pgsql を連携してみた

PostgreSQLの使い方を一通り覚えて、ようやく当初の目的である、Nagiosとの連携を試すことが出来た。 基本的には、PostgreSQLに貯めたsyslogから、該当時刻(ここでは15分ごととした) のログを取り出し、その中に正規表現で表現されるログがあるかどうかを探…

rsyslog-pgsql を使ってみた (2)

前回は、ユーザー postgres で書込みをしていたのだが、これはセキュリティ的にアレなので、きちんとユーザーを作ることにした。ユーザーとして、 rsyslogusr1 を作成し、データベース Syslog の全テーブルのアクセス権限を与えた。ユーザー作成 $ createuse…

rsyslog-pgsql を使ってみた(1)

以前Nagiosでプロセス数監視を行った際、合わせてログ監視が行えるかを調べていたのだが、Nagiosには、check_logs というプラグインも付属しており、エラーログなどが出力されているかどうかを確認することが出来ることがわかった。ただ、check_logs 内では…

puppet, nagios, ganglia でプロセス数監視 (2)

実際、puppet, nagios, ganglia でプロセス数監視を作ってみて、上手くいくことを確認した。 ww nagiosの追加設定: define service{ use generic-service hostgroup_name fedora-virt service_description ganglia_proc_sendmail check_command check_gangli…

puppet, nagios, ganglia でプロセス数監視

gmond で送付した内容を、nagios で監視できることを何回か前 ww に書いたが、 ganglia には、gmetric という、取得した値を合わせて送るためのコマンドが付属している。 このコマンドはcronで定義して、定期的に使うのが各種パラメータ(apache スレッド数、…

nagios, ganglia の連携

nagios (ノード監視) と ganglia(キャパシティ情報収集)は基本的な動作は異なるのだが、一部重複した機能もあり、両方を使うべきなのか、片方だけを使うべきなのかはいつも悩むところだったのだが、最近、次の資料を見つけた。http://www.ibm.com/developerw…