Smart incident detection and automation for an American multinational telecommunications company

HCLTech a permis une détection plus rapide, des flux de travail de réponse automatisés et une meilleure visibilité opérationnelle afin d'accélérer la restauration du service.
10 min de lecture
Partager

Vue d'ensemble

Un des principaux fournisseurs américains de télécommunications multinationaux soutient des millions d’abonnés grâce à une complexe et hautement répartie. Au fur et à mesure que les opérations prenaient de l’ampleur, la détection des incidents et les flux de travail de réponse sont devenus de plus en plus fragmentés, ce qui a ralenti la coordination entre les équipes de soutien et retardé le rétablissement des services.

Pour relever ces défis, HCLTech a mis en place une solution de gestion des incidents axée sur l’IA, bâtie sur la . La solution automatise la détection des anomalies, la communication sur les incidents et les flux de travail opérationnels — permettant une réponse plus rapide, une meilleure visibilité et une fiabilité accrue des services.

Le défi

Le client comptait sur des flux de travail manuels et fragmentés pour la détection des incidents et la communication. Les équipes de soutien devaient surveiller plusieurs outils, initier manuellement des appels ponts et créer des billets d’incident dans différents systèmes.

Ces délais ralentissaient le lancement du pont, l’engagement de la gestion des incidents majeurs (MIM) et l’analyse des journaux, ce qui augmentait le temps d’arrêt et affectait la fiabilité du service. De plus, la visibilité en temps réel limitée des communications d’incidents et du suivi des journaux rendait les enquêtes longues et inefficaces.

L’organisation avait besoin d’une solution centralisée et automatisée capable d’accélérer l’identification des incidents, de simplifier la communication et de fournir à la direction une visibilité en temps réel sur les incidents en cours.

L'objectif

L'organisation visait à moderniser les flux de travail de gestion des incidents pour améliorer la rapidité de réponse et la visibilité opérationnelle. Les principaux objectifs comprenaient :

L'objectif
  • Accélérer la détection des incidents et la réponse parmi les équipes d'opérations
  • Permettre un engagement plus rapide des équipes GMI et des ingénieurs de support en astreinte
  • Réduire les temps d'arrêt grâce à une isolation et une correction des problèmes plus rapides
  • Améliorer l'efficacité des enquêtes à l'aide de flux de travail d'analyse des journaux optimisés
  • Fournir à la direction une visibilité en temps réel sur l'état des incidents et l'activité sur le pont

La solution

HCLTech a déployé une solution intelligente d'orchestration des incidents basée sur Microsoft Power Platform (Power Automate et Copilot) afin de rationaliser les flux de travail de détection, de communication et d'intervention.

La solution
  • Détection d’anomalies en temps réel 
    La surveillance propulsée par l’IA détecte les anomalies et publie automatiquement des alertes dans les canaux de communication des incidents, assurant ainsi une visibilité immédiate pour les équipes de soutien.
  • Coordination automatisée des incidents 
    La solution initie automatiquement des ponts de conférence et déclenche les flux de travail d’intervention, éliminant ainsi les délais liés à la coordination manuelle.
  • Création transparente de billets 
    Des billets ServiceNow sont générés automatiquement lors du signalement d'anomalies, permettant un suivi plus rapide et une gestion structurée des incidents.
  • Engagement MIM accéléré 
    Les équipes de gestion des incidents majeurs (MIM) et les ingénieurs en garde sont notifiés instantanément, permettant une intervention rapide et une maîtrise efficace.
  • Visibilité centralisée des incidents 
    Un tableau de bord unifié offre à la direction des aperçus en temps réel de l'état des incidents, de l’engagement MIM ainsi que de l'activité du pont de soutien.

L'impact

L'implantation de la solution de gestion des incidents a permis d'obtenir des améliorations mesurables en efficacité opérationnelle et en performance de réponse aux incidents :

L'impact
  • Réduction de 100 % du délai moyen de détection (MTTD) grâce à une détection instantanée des anomalies
  • Réduction d'environ 80 % du délai moyen de prise en compte (MTTA) permettant une réponse plus rapide des équipes de soutien
  • Réduction d'environ 50 % du délai moyen de résolution (MTTR) entraînant une restauration plus rapide des services

Ces améliorations ont considérablement réduit les délais d'escalade, minimisé les interruptions de service et renforcé la fiabilité opérationnelle globale.

Beyond the Numbers

Au-delà des mesures opérationnelles, cette mise en œuvre a amélioré la collaboration et la transparence entre les équipes des opérations.

La visibilité des incidents en temps réel a permis à la direction de surveiller les incidents critiques sans dépendre des mises à jour manuelles, tandis que les flux de travail automatisés ont éliminé les retards causés par la coordination manuelle. Les équipes de soutien pouvaient se concentrer sur la résolution des problèmes plutôt que sur les tâches administratives, ce qui a considérablement augmenté la productivité et l'agilité opérationnelle.

La transformation a également renforcé le cadre de gestion des incidents de l’organisation, garantissant que l’infrastructure puisse évoluer de manière fiable avec l’augmentation de la demande de services.

Célébration du succès

En mettant en œuvre ces solutions, HCLTech a aidé le fournisseur de télécommunications à moderniser ses opérations de gestion des incidents grâce à l’automatisation axée sur l’IA et à l’orchestration intelligente.

La solution a non seulement accéléré la détection et la résolution des incidents, mais a aussi créé une base évolutive pour des opérations résilientes — assurant ainsi une prestation de services fiable à des millions d’abonnés.

DBS Affaires numériques Étude de cas Smart incident detection and automation for an American multinational telecommunications company