CA APM J2EEアプリケーションのためのパフォーマンス管理ソリューション

CA Application Performance Management

アプリケーションパフォーマンスコラム

コラム第1回 「Webシステムのダウン対策」

現在のWebシステムは、ほぼ大半がマルチスレッドで動作しています。その為、複数のリクエストを同時に受け付ける事が可能です。

 

同時に処理が可能な数はスレッド数と言えます。しかし、マルチスレッドで動作する処理には排他制御が必要な処理もあり、シングルスレッドでの動作が必要となる部分が発生します。また、1つのサーバーに複数の機能を実装する必要もあります。

 

【障害発生!】

 

デッドロックやスローダウンが発生すると、そのスレッドは、占有される事になります。そのときに、同じ処理をリクエストされると、同様にスレッドを占有される事になります。結果として、同時に処理できる数が少なくなるので、障害が発生していない機能までスローダウンしてしまい、最後には、システムダウンを引き起こします。

 

続きはこちら

コラム第2回 「サービスに障害が発生したときに、どの様な情報を求められますか? 」

こんな事を聞かれていませんか?

 

・障害の内容
・発生時刻(発生期間)
・影響を受けた件数
・影響を受けたユーザ


サービスを提供しているオーナーは、今回の障害でどれぐらいの影響が発生したのかが気になるからです。
リクエストに応える為に、何らかの手段で回答をしているかと思いますが、回答までにどれぐらいの時間が掛かっているのでしょうか?
ツール等で仕組みを持たない場合よくやる手段は、ログをはき出す仕組みをアプリケーションに組み込んで、大量に出力されているログを莫大な時間をかけて集計しています。また、その仕組みを作り込む為の開発やテストにも時間が掛かっています。
また、この様なログをファイルにはき出す仕組みは、アプリケーションのレスポンスに大きなオーバーヘッドを与えてしまいます。

 

さらに、問題箇所を絞り込む為に、さらにアプリケーションにログを出力する仕組みを作り込んで、莫大なログから問題箇所を探します。

 

いったいどれだけエンジニアが障害調査の為に、開発時からどれぐらいの手間をかけているのでしょうか?
そして、その費用は、開発費、運用費に転嫁されているのです。

 

続きはこちら

Copyright Samuraiz Corporation. All Rights Reserved.