CFみたいな重厚なPaaSは外部から見える情報は限られてそうだけど、どうするのかなーと思って調べている.
運用管理系ソフトのラインナップ
この分野、全く明るくない. まずはどんなソフトがあるのか調べてみる.ZABBIX
http://www.zabbix.com/jp/product.php一番メジャーっぽい運用監視ソフト.
Cloud Foundryと組み合わせる記事を見つけた. CF外部からCF内部で動いているアプリケーション・サービスは限られているので、この記事だとCF内部にZabbixを入れている…
http://www.fraction.jp/log/archives/2014/06/23/monitoring-cf-with-zabbixBOSH使えば可能なんだろうけど、正直かなり面倒くさそう…記事の人も書いているが、BOSHでよくね?と思った. 豊富なチャートがあったりと見た目がいいのが災いするのかな.
補足
障害が発生した際に、発生したサーバにシェルコマンドで再起動命令を送ることができる. 自分なら障害発生をJenkinsみたいなリモートホストを機械的に操作するのに特化したツールに通知して、具体的な障害復旧作業はそちらに任せたいな.Jenkinsじゃなくてもいいけど、そういうツールないかな.
- リモートサーバを自由度高く、機械的に操作できて(Chef, Capistrano3)
- 操作履歴を記録として残せるもの.
Nagios
http://www.nagios.com/Zabbixと同程度には重厚長大な感じ. デモサイトを見てみたけど「うん、分からん」状態. 機能が豊富すぎてどこから触っていいやら.
チャートはSVG、サイトはhtml5の要素で構成されていて見た目はかなりいい. でも騙されないぞ.
- Nagios XI - Nagios Coreの有償版的な何か
- Nagios Fusion - 導入組織全体のネットワーク稼働状態を集中監視
- Nagios Incident Manager - インシデント管理用のWebアプリ?
- Nagios Network Analyzer - ネットワークフローのデータ解析
- Nagios Core
Hinemos
NTTデータ製. 2005年から公開. 10年とか長寿だな…ざっと見た感じJavaで実装されていてDBにPostgresを使っている. 利用しているソフトウェアは昔からある固いものが多い印象. 日本製ってことで日本語のドキュメントは充実している.Xymon(Hobbitmon)
http://xymon.sourceforge.net/サーバー・ネットワーク監視用ソフトウェア. 公式サイト、デモ共に見辛い…あとデザインが古い感じがする. 上の3ツールに比べまた極端な感じ.
Kibana x Elasticsearch x fluentd
アプリケーションの吐き出したログ、ネットワークログ、DBログを監視するだけの用途ならこの組み合わせでいいんじゃないかな. 本格的に使うなら作りこまないといけないだろうけど.感想
ソフト自体は息が長いのが多く、一言でいって重厚長大. なぜ1ソフトでありとあらゆる機能を持とうとするのか…orz 正直、サービスまたコンポーネント単位にソフト分割してIaaSまたはPaaS上に使用するものだけ放り込みたい.スケール調整機能など監視結果をクラウドシステムにフィードバックする機能をどの程度持てるかが選定する上で肝になりそう. まぁオートスケール機能なんかは、クラウドシステム自体が持てばいいじゃない、と思うけど.
もしかして、BOSHにFluentdなりKibanaなりを追加して同一クラスタマシンで動作するサービスの監視させたほうが安上がりだったりするのん…? HatoholとかいうOpenStack上に定義した複数のネットワークで同一ネットワークのノードを監視するZabbixを更に統括するツールを作っている人たちもいるみたい.
http://www.slideshare.net/kz0817/osc-tokyo-20140228
https://github.com/project-hatohol/hatohol
Written with StackEdit.
No comments:
Post a Comment