AppDynamics 導入事例

合同会社DMM.com様

DMM.comは「レガシーな」密結合システムから
いかに脱却したのか

動画配信や電子書籍などの総合的なデジタルエンターテイメントを手掛ける企業であるDMM.com。同社の各サービスは「レガシー化」した共通モジュールで密結合され、相互接続関係がブラックボックス化してしまっていた。これにより、リリースのスピード向上を阻害し、障害時の原因の特定や切り分けに時間を要していたという。現在、この状態を切り抜ける施策を打った同社は、どのように依存関係を可視化し、「レガシーな密結合状態」から脱却を推進したのか。


DMM.comはどのように密結合システムから脱却し、可用性の高い環境を手に入れたのか


それぞれのサービスが密結合し、依存関係が複雑化

動画配信をメインに、40以上の多種多様なサービスを提供するDMM.com。デジタル事業のほかにも、豊洲に「teamLab★Planets TOKYO DMM.com」という体験型のアミューズメントパークを展開し、アフリカで海外事業を展開するなど、バリエーションに富んだ事業を次々と世に送り出している。

VRなどを活用し、配信できるコンテンツもリッチになり、デジタル事業を支えるインフラは、ピーク時には200Gbpsを超えるトラフィックを扱うこともある。継続的にサービスを提供するために、オンプレミス、パブリッククラウドを併用したインフラ基盤を構築、運用している。

そんな同社のIT基盤は、これまで各サービスが共通モジュールによって密結合していた。このモジュールは、長く同社のサービスを構成してきた。しかし、いわば“レガシー化”した共通モジュールのせいで、たとえば新しいサービスを開発、リリースする際にミスがあったりした際に、サービス全体に影響が波及してしまう課題があった。

現在、同社では1日に数多くの、新たなコンテンツやサービスなどの更新がある。たとえば、サービスのタイトルが新しくリリースされたときに、新たなコードを書いてデプロイを行うが、その際も共通モジュールに手を加えなければならない。コードを間違えていた、あるいは、それぞれのアクセスが止められてしまうようなコードが含まれていた場合、サービス全体が止まってしまう可能性があった。

リリースのたびに、ほかのビジネスの機会損失を伴うリスクが発生するため、担当者はリリース作業に神経を尖らせる必要があり、これがサービス更新のスピードを下げる一因となっていた。

さらに、それぞれのサービスが密結合し、依存関係が複雑になった結果、障害が発生したときに、原因の特定や切り分けに時間がかかり、復旧に時間を要していた課題もあった。

レガシー化したモジュールの運用は、いつの間にかブラックボックス化し、すべての構造を理解している人がいないため改修が困難になるといった弊害を生んだ。

そこで、共通モジュールを使わない仕組みを作り、デプロイの影響が個別のシステム内で収まるような環境を整備する必要があったのだ。

実は、同社ではこれまで何度か、密結合状態からの脱却にトライしたが、実現に至らなかった経験がある。しかし、サービスのスピーディなリリースは待ったなしのテーマであり、2017年から問題解決に着手した。「共通モジュールからの脱却」「各サービスの分離・独立」をどのように進めていったのだろうか。


「各サービスの依存関係の可視化」でわかること

「共通モジュールからの脱却」「各サービスの分離・独立」に向け、まずは密結合した各サービスの依存状況を可視化する必要があったという。 インフラ部 サーバインフラグループ グループリーダーの綱島政人氏は、「プロジェクトの前段階として、ネットワーク構造の可視化から着手することにした」と説明する。

そこで白羽が立ったのが、アプリケーション性能監視ソフトウェア「AppDynamics(アップダイナミクス)」だ。同ツールは、Javaや.NET、PHPなどWebアプリケーションの性能を監視・管理し、障害予兆や隠れた性能問題を検出するためのツールだが、これを、サービス分離を進める上で、ネットワークだけでなく「各サービスの依存関係の可視化」に使うことにしたのだ。


ITインフラ本部 インフラ部
サーバインフラグループ
グループリーダー
綱島政人氏


DMM.comのシステム構成図



インフラ本部 インフラ部
サーバインフラグループ
サービスフロントチーム
日名川幸矢氏

アップダイナミクス選定のポイントとして、綱島氏は次のように述べる。

「いくつかのツールが検討の俎上にのぼりましたが、競合ツールは、当社の開発が使うPHPのバージョンではデータが取得できないことがわかり、そこに対応できる点がアップダイナミクスを選定した大きなポイントです」(綱島氏)

また、視覚的な「わかりやすさ」がポイントだと述べるのが、同社 インフラ部 サーバインフラグループ サービスフロントチームの日名川幸矢氏だ。

「フロント側から各システムにつながる構成が、フローマップでひと目見て全体像が把握できました。専門知識がなくても、誰でも使える使い勝手もあいまって、アップダイナミクスを選ぶことにしました」(日名川氏)

まずはトライアルで動画配信サービスのネットワーク構成の可視化を行い、その実績を見ながら全体に展開していくこととなった。

では、SIベンダーとしてサムライズが選ばれた理由はどこにあるのだろうか。綱島氏は「サムライズとは、以前より動画配信サービスで取引実績があった」ことに加え、「サポートの手厚さ」をポイントとして挙げる。

「SIベンダーの候補は、アップダイナミクスを扱うパートナーから3社ほど挙がりましたが、アップダイナミクス(現:シスコシステムズ)側から、特にサポートがしっかりしているパートナーであるという推薦を受け、サムライズにお世話になることにしました」(綱島氏)

導入検討が開始されたのは2017年で、実際に導入、利用が開始されたのは2018年に入ってからとなった。


アプリケーション性能監視ソフトウェア「AppDynamics」にはさまざまな利用方法がある


作業時間は8時間から30分に短縮、作業の標準化も実現

現在は、共通モジュールからの脱却プロジェクトが進行中だ。その中にあって、アップダイナミクスは上述したようなネットワーク構造の調査用途で、主にエンジニア向けに利用されている。

「本来のアプリケーション監視のためには、通常、1つのシステムに対して、サーバ全台にエージェントを入れるのですが、調査目的の例外的な使い方になるため、システムに対して1つのエージェントを入れ、システム間の依存関係を可視化、把握するという使い方をしています」(綱島氏)

アップダイナミクスの導入効果としては、「手作業からの脱却」が挙げられる。これまで通信状況を調査するには、サーバに対して手作業でコマンドを送信し、通信状況を確認していた。

「アップダイナミクス導入後は、画面を確認するだけで通信状況が可視化されるので、これまで1日がかりで行っていた準備から確認までの作業が30分程度に短縮されました」(綱島氏)

作業に「抜け」「漏れ」がなくなった点も大きい。アップダイナミクスによって、エンジニア間で画面が共有され、共通認識が持てるようになった結果、「取得すべきデータや作業の抜け、漏れがなくなり、属人的な作業から脱却することができるようになった」と日名川氏は述べる。

同じツール、同じ画面で認識が共有できるようになった結果、コミュニケーションコストが下がり、インフラ運用に対して各事業部に当事者意識が生まれ、ディスカッションが活性化する効果も得られた。

現在までに、密結合脱却のためのプロジェクトは、特にビジネス機会損失の影響が大きい2事業で完了した。この先も残る事業のサービス分離を進め、全体影響の軽減を図ることでサービスに貢献していくと綱島氏は説明する。

現在、他の事業部でも脱却プロジェクトを進行しているところだが、日名川氏は「アップダイナミクスは、呼び出す関数ごとにトランザクションをモニタリングし、きめ細かく可視化できるため、他のアプリケーション監視ツールに比べて、特に、プログラムのどの部分に問題があるかを調査したいというニーズに対しては最適だ」と言い切る。


アップダイナミクスで実現するパフォーマンスマネジメント


「サービスファースト」のインフラ整備に必要な考え方

今後の同社のIT活用について、綱島氏は、「さらなるデプロイの自動化を進めていきたい」と述べる。今後はさらにパブリッククラウド利用の比率が高まるため、クラウド、オンプレミスそれぞれに最適なシステム構成を選択できるよう、見直しを進めているところだ。

あわせて、開発だけでなく、業務的にも手作業が多いインフラ環境構築の業務フローを見直し、「開発者がコマンド一発で最適なインフラが準備できるよう」開発者にもインターフェースを提供していきたいと綱島氏は抱負を述べる。

その中でサムライズ、あるいはAppDynamicsに期待することとして綱島氏は次のように話してくれた。

「システムの可視化をさらに進めていく中で、今の調査用途から、本来のアプリケーション監視の用途に拡大していきたいです。アップダイナミクス活用についてのさらなる展開案を、ぜひサムライズさんに提案いただきたいと考えています」(綱島氏)

特に、アップダイナミクスはできることが多いツールであるがゆえに、どういう使い方でどんなメリットがあるのか、ユースケースの共有や、ツールを深く使いこなすための技術面でのサポートを期待したいとのことだ。

システムの分離、独立が実現できた先には、「障害をユーザーからの申告で知るのではなく、自分たちの事業部門のエンジニアが検知、対応できる仕組みを実現したい」と日名川氏は話す。

そのために、たとえば「AIと機械学習を利用し、重大な問題が起きる前に、不具合の予兆を発見することを助ける機能などにも期待したい」と期待を話してくれた。そして、開発スピードのさらなる向上にも取り組んでいく考えだ。

「これまで、インフラは、主にコスト面からクラウド、オンプレのどちらを利用するかを検討していましたが、これからはそのサービスをリリースする上で、最適なプラットフォームは何か、という観点で、最適な環境を整備していく考えです」(綱島氏)

こうした「サービスファーストでのインフラ整備」を進めていく上で、アップダイナミクスとサムライズの豊富な実績に基づく支援に寄せる期待はさらに高まるばかりだ。


導入企業プロフィール

合同会社DMM.com

ACCORDIA GOLF
設立 :1999年11月17日
資本金:10百万円
従業員数:1527名

  • 30日の無償トライアルをご用意しています

    ≪無償トライアルの流れ≫

    ・事前ヒアリング(1日)
    ・ライセンス申込と発行
    ・エージェントインストールなど環境構築(1日~)
    ・モニタリング状況確認
    ・最終結果レビュー
    ・評価内容反映したご提案

  • アプリケーション性能改善
    コンサルティングサービス

    ≪WEBアプリケーションに関する性能トラブル調査から改善までお任せください≫

    トラブル調査やリリース前検証テスト、データ集計、分析、レポーティングなど、お客様の状況に合わせて経験豊富なエンジニアが代行します。

 

Copyright Samuraiz Corporation. All Right Reserved.