CA APM J2EEアプリケーションのためのパフォーマンス管理ソリューション

CA Application Performance Management

アプリケーションパフォーマンスコラム

コラム第2回 「サービスに障害が発生したときに、どの様な情報を求められますか?」

こんな事を聞かれていませんか?

 

・障害の内容
・発生時刻(発生期間)
・影響を受けた件数
・影響を受けたユーザ


サービスを提供しているオーナーは、今回の障害でどれぐらいの影響が発生したのかが気になるからです。
リクエストに応える為に、何らかの手段で回答をしているかと思いますが、回答までにどれぐらいの時間が掛かっているのでしょうか?
ツール等で仕組みを持たない場合よくやる手段は、ログをはき出す仕組みをアプリケーションに組み込んで、大量に出力されているログを莫大な時間をかけて集計しています。また、その仕組みを作り込む為の開発やテストにも時間が掛かっています。
また、この様なログをファイルにはき出す仕組みは、アプリケーションのレスポンスに大きなオーバーヘッドを与えてしまいます。

 

さらに、問題箇所を絞り込む為に、さらにアプリケーションにログを出力する仕組みを作り込んで、莫大なログから問題箇所を探します。

 

いったいどれだけエンジニアが障害調査の為に、開発時からどれぐらいの手間をかけているのでしょうか?
そして、その費用は、開発費、運用費に転嫁されているのです。

 

これらを、ツールを導入する事で一気に解消するとしたら、どれだけのコストが改善されるかを考えてみて下さい。

 

これらの手間を改善するツールが存在します。

 

https://www.samuraiz.co.jp/product/wily/index.html

 

CA APMを導入すると、ユーザのリクエストとサーバからのレスポンスをパケットキャプチャーして、レスポンス時間、レスポンスコードなどからレスポンスが正常に帰っているかを判断します。すべてのリクエスト数に対して、正常なレスポンスが何パーセントであったかをSLAとしてレポートします。URL単位で目標値を設定する事が出来ます。

 

 

 

さらに、成功率、レスポンスの変化がどの様になっているかをレポーティングしてくれますので、取り返しの付かない障害が発生する前に対応を始める事が出来ます。

 


 

もし、障害が発生したときは、URL単位に検知してさらに、アプリケーションサーバに組み込んだAgentが取得した細かい情報でアプリの動きをすぐに解析する事が出来ます。

 

 

 

 

Agentは、指定したメソッドの実行時間、実行回数などを取得していてそれらは、リアルタイムでグラフ化されます。集計する手間もなくすぐに状況を把握する事が出来ます。Agentが測定したデータは、長期保管も出来ますのでさかのぼってデータを比較する事も出来ます。測定箇所の指定もソースコードに手を入れることなく、また、センサーコードも実行時に自動で挿入されるので、コード管理の手間は発生しません。

なので、アプリケーションの開発時に、障害対応の為の仕組みを色々考えて作り込むよりも、このツールを利用した方がコストの削減につながります。

 

第3回に続きます。

Copyright Samuraiz Corporation. All Rights Reserved.