Transformation de la stabilité de l’écosystème ServiceNow

Comment HCLTech a aidé une plateforme mondiale de paiements numériques à stabiliser leur écosystème ServiceNow et à offrir des gains opérationnels multimodaux grâce à l’automatisation, au nettoyage des données et à la surveillance prédictive
5 min de lecture
Partager

Aperçu

Une de premier plan opérant à l’échelle mondiale dans des centaines de marchés dépend de ServiceNow comme colonne vertébrale essentielle pour les opérations informatiques, la gestion des services et la continuité des activités. À mesure que l’organisation prenait de l’ampleur rapidement, son écosystème ServiceNow s’est également développé en taille et en complexité. Au fil du temps, cette croissance a créé des défis opérationnels qui ont commencé à affecter l’efficacité, la réactivité du système et la gouvernance.

Pour relever ces défis et exploiter tout le potentiel, l’organisation s’est associée à HCLTech pour transformer son environnement ServiceNow en un écosystème stable, automatisé et évolutif.

Le défi

Gérer l'échelle, la complexité et les inefficacités opérationnelles

À mesure que l’écosystème ServiceNow s’est développé, plusieurs défis interconnectés ont commencé à affecter la performance, l’efficacité opérationnelle et la gouvernance :

Le défi
  • La CMDB avait dépassé 20 To, ce qui créait une pression sur le stockage, ralentissait la performance et augmentait les coûts d’infrastructure.
  • Des perturbations de performance persistantes—including semaphore saturation, SQL anomalies and node restarts—entraïnaient des incidents fréquents et une résolution de problèmes de façon réactive.
  • Des volumes importants d’éléments de configuration (CI) obsolètes, en double ou orphelins, combinés à des lacunes de découverte à travers les environnements d’entreprise, de site et de crédit, réduisaient la visibilité des actifs et la fiabilité des données.
  • Un nombre élevé de demandes de service initiées via Slack et de billets répétitifs augmentait la charge de travail des équipes de soutien.
  • Les défis de gouvernance lors des mises en production, des intégrations et d’importantes transactions API introduisaient des risques opérationnels et affectaient la stabilité.
  • L’environnement nécessitait des processus opérationnels évolutifs capables de soutenir un paysage distribué et de maintenir la préparation aux audits.

Ensemble, ces facteurs ont mis en lumière la nécessité d’un modèle opérationnel plus automatisé, structuré et évolutif afin de rétablir la stabilité et l’efficacité.

L’objectif

Améliorer la résilience, l’automatisation et l’efficacité opérationnelle

L’organisation a défini une feuille de route claire pour améliorer leur écosystème ServiceNow et assurer sa pérennité à long terme. Les principaux objectifs incluaient :

L’objectif
  • Tirer parti de ServiceNow Instance Observer pour identifier et résoudre de manière proactive les problèmes de performance, afin d’améliorer la fiabilité du système et l’expérience utilisateur.
  • Nettoyer et optimiser la CMDB pour récupérer de la capacité de stockage et améliorer la précision des configurations.
  • Automatiser les demandes de service répétitives et minimiser l’intervention manuelle.
  • Identifier et corriger les incidents récurrents.
  • Améliorer la gouvernance des processus de publication et de mise à niveau afin d’assurer des publications et mises à niveau plus fiables et sans interruption.
  • Moderniser l’infrastructure mid-server et optimiser l’architecture de découverte pour accroître la stabilité et l’évolutivité du système.
  • Renforcer la sécurité des API en mettant en œuvre des politiques d’accès pour les API de table et en faisant passer les comptes de service API de l’authentification de base à OAuth 2.0.
  • Améliorer la performance du système grâce à l’optimisation architecturale, à la séparation des nœuds UI/Work et à la mise en place de la gouvernance des API afin de réduire les transactions API à volume élevé.

Ces priorités visaient à créer un environnement ServiceNow robuste, automatisé et à haute performance, capable de soutenir la croissance de l’entreprise.

Objectif

La solution

Assurer la stabilité de la plateforme grâce à l’automatisation, à la modernisation et à la gouvernance

La solution

Présentation de l’observabilité et de la remédiation proactive

HCLTech a mis en place des capacités d’observabilité pour analyser en continu les schémas de réponse des serveurs, l’activité SQL et l’utilisation du processeur. Cela a permis la détection précoce des anomalies et des risques de performance. Des alertes automatisées et des flux de travail de remédiation prédéfinis ont aidé les équipes à résoudre les problèmes de manière proactive, réduisant ainsi le bruit et minimisant le dépannage réactif.

Modernisation de l’infrastructure mid-server et optimisation de la découverte

Une infrastructure mid-server a été migrée, remplaçant plus de 15 machines virtuelles et installant 89 services mid-server pour la découverte et l’intégration. Cette modernisation a amélioré la stabilité de la plateforme, réduit la surcharge de l’infrastructure et accru la performance de la découverte. De plus, l’introduction de plus de 40 nouveaux horaires de découverte, combinée à l’ajustement des mid-server, a permis d’éliminer les lacunes de découverte et d’améliorer la précision des données de configuration.

Amélioration de la santé du CMDB grâce au nettoyage automatisé des données

Une initiative de nettoyage structuré du CMDB a été lancée afin d’améliorer la précision des données et de récupérer la capacité de stockage. Des flux de travail automatisés ont été mis en œuvre pour identifier et supprimer les enregistrements obsolètes, éliminer les éléments de configuration en double et régler les entrées orphelines. Ces efforts ont considérablement amélioré l’intégrité du CMDB, permettant une meilleure visibilité des actifs et une prise de décision opérationnelle plus précise.

Renforcement de la gouvernance des versions et des contrôles opérationnels

HCLTech a mis en place des procédures d’exploitation normalisées pour la gestion des versions, des incidents et des mises à niveau tout en améliorant les pipelines de version et en adoptant une approche structurée de la mise à niveau, notamment un plan de mise à niveau rationalisé de Zurich sur trois semaines. Ces initiatives ont renforcé la fiabilité du système, minimisé les risques opérationnels et consolidé la gouvernance à travers les intégrations, les API et les mises à niveau de la plateforme.

Analyse et indicateurs opérationnels améliorés

Une analyse approfondie des tendances des billets, l’identification des causes profondes des incidents répétés ou de longue date, et leur résolution ont été réalisées. Le module d’interaction a été utilisé et l’automatisation par chatbot a été mise en place pour recueillir les requêtes des utilisateurs. Des processus automatisés de traitement des demandes les plus fréquentes ont été mis en œuvre et le volume des demandes de service a été réduit de 64 %.

L’impact

Offrir des améliorations mesurables en performance, efficacité et capacité

L’impact

Amélioration de la performance de la plateforme et réduction du volume des demandes de service

  • Résolution de plus de 16 problèmes majeurs de performance, incluant des anomalies SQL, saturation des sémaphores, délais du planificateur et redémarrages de nœuds.
  • Configuration de plus de 23 alertes de l’observateur d’instances, permettant une revue et une résolution d’alertes plus rapides et minimisant les interruptions opérationnelles.
  • Réduction de 40 % des transactions API grâce à des optimisations API, réduisant considérablement la charge API et améliorant la performance de la plateforme.
  • Réduction de 64 % du volume des demandes de service grâce à l’optimisation du nettoyage des données et à l’automatisation des processus.
  • Analyse des journaux d’erreurs système et réduction de 70 % de la génération d’erreurs au niveau du code.

Réduction significative des délais de mise à niveau

  • Réduction de 67 % des délais de mise à niveau par rapport aux mises à niveau précédentes.
  • Réduction de 66 % des périodes de gel de changements lors des mises à niveau de version, permettant le développement et le déploiement continus tout en réduisant les interruptions des livraisons.

Amélioration de la santé du CMDB et récupération de capacité de stockage

  • Suppression de plus de 9 millions d’enregistrements périmés, élimination de 6 959 entrées dupliquées et résolution de plus de 2 281 enregistrements orphelins, améliorant considérablement l’exactitude des données.
  • Réduction de l’utilisation du disque d’environ 20,17 To à 14,73 To, avec une stabilisation optimisée à 15,2 To, démontrant une meilleure efficacité de stockage et une capacité récupérée.

Renforcement de la stabilité de la plateforme et de la précision de la découverte

  • Suppression de plus de 9 millions d’enregistrements périmés, élimination de 6 959 entrées dupliquées et résolution de plus de 2 281 orphelins
  • Amélioration de la couverture de la découverte avec plus de 40 horaires de découverte additionnels, améliorant la visibilité sur les configurations et l’exactitude des actifs.

Livrer le résultat ensemble

  • Cette transformation a été menée grâce à une collaboration étroite entre notre client et HCLTech, alliant une expertise approfondie de la plateforme à des compétences éprouvées en automatisation et en services gérés. En s’alignant sur des indicateurs de performance et des KPI opérationnels clairs, le partenariat a permis d’obtenir des améliorations significatives et mesurables tout en assurant la continuité du service sans interruption.

Conclusion

Avec une plateforme ServiceNow plus stable, automatisée et optimisée en place, l'organisation est bien positionnée pour faire évoluer ses opérations et soutenir sa croissance future. Les initiatives en cours se concentrent sur l'expansion de la couverture de l'automatisation, le renforcement des capacités de surveillance prédictive et l'amélioration continue de la gouvernance et de la précision de la découverte CMDB.

Ces améliorations permettront à l'organisation de maintenir un écosystème ServiceNow performant et rentable qui continue d’offrir fiabilité, efficacité et excellence opérationnelle à grande échelle.

DFS Gestion unifiée des services Étude de cas Transformation de la stabilité de l’écosystème ServiceNow