リアクティブなITから自律的な運用へ:AIを活用した自動化で企業のレジリエンスを強化

HCLTechは、食品・飲料業界を牽引する世界的企業が断片化したIT運用をインテリジェントで自動化主導、かつレジリエンスに優れたデジタルエコシステムに変革できるよう支援しました。
所要時間 10分
共有

概要

多くの市場で事業を展開する食品・飲料業界の世界的メーカーは、広大なデジタルエコシステムを頼りに、製造、サプライチェーン、流通、企業運営を推進しています。デジタルフットプリントが拡大するにつれ、従来の監視アプローチでは対応しきれなくなり、複雑さとリスクが積み重なっていきました。

このような課題に正面から取り組むため、このクライアントはHCLTechと連携し、ServiceNowでAIOps主導の次世代IT運用管理(ITOM)に向けた変革を実現しました。私たちの焦点は、AIを活用した可観測性の構築、運用の標準化、自動化主導の効率化でした。その結果、企業規模で予測的かつ自律的な運用に移行することができました。

課題

ITの俊敏性を制限するレガシーシステムと断片的な可観測性

組織のITランドスケープがグローバルに拡大して運用の可視化と調整がますます複雑になったことで、インシデントをプロアクティブに管理し、サービスの信頼性を維持する能力が制限されるようになりました。

Challenge

主な課題は以下のとおりです。

  • 旧式の監視ツールの機能に制限があるため、自動化とサービスオーケストレーションの能力に限界がある
  • 予測監視とAIを活用した異常検出が欠如し、インシデントの特定と解決に時間がかかる
  • 断片化したIT環境が、インフラ、アプリケーション、監視プラットフォーム間でデータのサイロ化を引き起こしている
  • イベント相関が標準化されていないため、アラートが重複し、平均検出時間(MTTD)と平均解決時間(MTTR)が長くなる
  • 観測可能なデータがツール間で分断されているため、運用に関するインサイトを統合できず、サービスの正常性を1か所で確認できない
  • 手作業によるCMDBの更新と限定的な関係マッピングによって、サービスの可視性と根本原因の正確性が低下している

このような制限事項によって、運用の作業負荷が増大し、サービスの信頼性が低下して、IT運用を効率的に拡張することが困難になっていました。

目的

予測的かつ自動化主導のIT運用に企業規模で移行

長期的なデジタル戦略をサポートするため、クライアントはIT運用の近代化に着手しました。

Objective

主な目標は以下のとおりです。

  • インフラ、アプリケーション、サービスを観測できる統合プラットフォームを確立
  • AI/MLを活用したでインシデントの予測検出と異常の特定を可能に
  • ゼロタッチのアラートからチケットの作成と自動修復ワークフローを導入
  • アラート、イベント、サービスの正常性を1か所で確認できるようにし、運用の可視性を向上
  • ハイパーオートメーションと自己修復機能によってインシデント件数、運用の作業負荷、MTTRを削減
  • 構造化されたで運用プロセスを標準化し、ガバナンスを改善
  • 拡張性に優れ将来に対応するIT運用フレームワークを構築し、グローバルなデジタル成長をサポート

ソリューション/解決策

AIOpsと自動化を統合しインテリジェントな運用を実現

私たちは、 ITOM、AIOps、ハイパーオートメーションを活用した包括的な変革を実施し、インテリジェントで観測可能なIT運用フレームワークを構築しました。この取り組みでは、運用の標準化、自動化主導の効率化、AIを活用した可観測性という3つの優先事項に焦点を当てました。

可観測性の統合、AIを活用した分析、インテリジェントなイベント相関、修復の自動化といったAIOpsの中核となる原則に基づいて実施されたこの変革によって、クライアントは予測可能で自律的な運用へと移行できました。

Solution

企業全体で可観測性を統合

観測可能なプラットフォームを一元化し、75以上の監視ソースからイベント、メトリクス、ログ、トレースを取り込み、インフラとアプリケーション全体でリアルタイムの運用の可視性を実現しました。

AIを活用したイベント相関によって、関連するアラートを自動的にグループ化してアラートノイズを低減し、根本原因を迅速に特定できるようにしました。また、ServiceNowのサービスマッピングで、100個以上のビジネスアプリケーションにまたがるサービスを意識したビューを作成したことで、チームはサービスの依存関係を理解し、効果的に修復の優先順位をつけられるようになりました。

これらの機能を組み合わせることで、企業のサービスの正常性を1か所で確認できるようになり、監視の精度と運用の可視性が大幅に向上しました。

ハイパーオートメーションと自己修復運用を推進

私たちは、Ansible AWXと自動化ボットによる大規模な自動化フレームワークを導入し、運用のインシデントとインフラ管理タスクの自動解決を実現しました。

自動化に向けた主な取り組みは以下のとおりです。

  • インフラとアプリケーション環境全体に172件以上の自動化ユースケースを導入
  • 239件のプレイブックをAnsible自動化フレームワークに移行し、最適化
  • 2万台以上のサーバーと1万7,000台以上のネットワークデバイスをカバーする自動化カバレッジ
  • 月間約5万件のチケットを自動処理

自己修復機能によって、データセンター、ネットワーク、クラウド環境全体で繰り返し発生する問題をプロアクティブに解決し、手作業による運用介入を大幅に削減しました。

インフラの近代化と運用効率を加速

この変革では、自動化主導のインフラ改善も導入し、レジリエンスと運用効率を強化しました。

主な取り組みは以下のとおりです。

  • 2万台以上のサーバーでAgent Client Collectorを使って、レガシーインフラの監視をServiceNowに移行
  • 標準化されたテンプレートと自動プロビジョニングによって、WANからSD-WANへの近代化を自動化
  • パッチ適用の自動化を統合し、95%以上のサーバーをカバー
  • iOS、Rubrik、Palo Alto、SD-WANプラットフォームにおけるアップグレードの自動化サポート
  • データセンター、ネットワーク、クラウド環境に100件以上の自己修復ボットを導入
  • サーバーやネットワークの廃止と孤立したサーバーの修復を自動化

このような取り組みによって運用効率が大幅に向上し、いくつかのインフラプロセスでは60%以上の工数削減を達成しました。

オペレーショナルインテリジェンスと継続的な最適化を強化

長期的な価値を維持するため、私たちは自動化ダッシュボード、価値報告フレームワーク、継続的な最適化メカニズムを導入しました。

主な機能は以下のとおりです。

  • 可観測性と自動化の正常性監視ダッシュボード
  • 約90%の精度でネットワーク容量を報告
  • インフラ災害復旧を自動化し、RTOとRPOを約20%改善
  • 継続的な最適化および維持プログラムによって運用パフォーマンスを向上

この構造化されたアプローチによって、継続的なサービス改善と長期的な運用レジリエンスを確保できました。

ソリューション/解決策

インパクト/成果

効率性、自動化、運用のレジリエンスにおける測定可能な成果を推進

この変革によって、クライアントのグローバルなITランドスケープ全体で、運用効率、サービスの信頼性、自動化の成熟度が大幅に向上しました。

Impact

インシデントの迅速な解決と運用の作業負荷の軽減

自動化とAIを活用した修復によって、IT環境全体のインシデント対応と解決が大幅に加速しました。

  • 予測検出と自動修復で平均解決時間(MTTR)を70%削減
  • 月間5万件のチケットを自動処理し、サービスデスクの作業負荷を大幅に削減
  • インシデント全体での自動解決率は最大30%
    • ServiceNow AI/MLを活用した相関を使ってイベントとアラートノイズを90%削減し、運用効率を大幅に向上

このような改善のおかげで手作業による介入が減り、より迅速で一貫性のあるサービスリカバリが可能になりました。

大規模な自動化による大幅な生産性向上

自動化フレームワークとボットを活用したワークフローによって、インフラとサービスオペレーション全体の運用効率が大幅に向上しました。

  • 自動化で運用効率が向上し月間4万3,000時間を削減
  • ボットを活用したワークフローと自動化フレームワークで月間3万5,000時間を削減
  • 最大45%の自動化のポテンシャルを特定初年度に17%の自動化を実現

これによって、チームは反復的な運用業務から、より価値の高い戦略的イニシアチブに焦点を移せるようになりました。

企業インフラ全体で自動化の範囲を拡大

この変革によって、重要なインフラ層全体に自動化が拡大し、運用の一貫性と信頼性が向上しました。

  • 自動化成功率は90%。自動化ワークフローの高い信頼性を実証
  • 90以上のAnsible自動化ユースケースをインフラ運用全体に導入
  • データセンター、ネットワーク、クラウド環境全体で最大67%のチケットをボットが解決
  • 100個以上の自己修復ボットをインフラ環境全体に導入

このような機能によって、インフラの安定性を強化しながら、より迅速な問題解決が可能になりました。

サービスガバナンスと企業の可視性が向上

可観測性とサービスガバナンスのフレームワークを統合することで、運用の透明性とグローバルチーム間のコラボレーションが向上しました。

  • 企業における観測と監視を1か所で管理
  • 業界のベストプラクティスに合わせて一元化されたサービス管理プラットフォーム
  • 運用、戦略的パートナー、グローバル部門、セクターチーム間の調整を強化
  • 観測可能なデータ、自動化のパフォーマンス、運用の正常性に関するレポート作成フレームワークを強化

このガバナンスモデルによって、企業のサービスパフォーマンスの可視性を向上させながら、運用管理を強化しました。

持続的な運用の最適化と長期的な価値の実現

継続的な監視、価値の報告、最適化プログラムによって、持続的なパフォーマンスの向上と長期的な運用の成熟を実現します。

  • 正常性の自動監視と可観測性ダッシュボードで継続的にパフォーマンスを追跡
  • IT運用の継続的な向上と最適化の取り組み
  • 構造化された持続モデルで長期的な拡張性と運用レジリエンスをサポート

このような改善によって、拡張性に優れた自動化ファーストのIT運用フレームワークが確立され、クライアントのグローバルなデジタル成長の支えとなっています。

結論

この変革には、グローバルなデジタル目標に合わせて、レジリエンスと拡張性に優れたインテリジェントなIT運用エコシステムを構築しようというクライアントのコミットメントが表れています。このパートナーシップでは、クライアントの戦略的ビジョンとHCLTechの専門知識を組み合わせることで、企業のITサービスデリバリの再定義に成功しました。

この変革を通じて、クライアントは現在、迅速な問題解決、運用の透明性の向上、拡張可能な運用フレームワークいったメリットを享受し、継続的なデジタルイノベーションと企業の成長を実現しています。

DFS 統合サービス管理 ケーススタディ リアクティブなITから自律的な運用へ:AIを活用した自動化で企業のレジリエンスを強化