Unification du paysage des données pour améliorer l’analyse et la collaboration
Notre client est l’un des plus grands détaillants d’ameublement au monde, présent dans plus de 60 pays, offrant à ses clients des expériences d’achat immersives rendues possibles par un vaste et complexe réseau de chaîne d’approvisionnement comprenant des franchisés, des fournisseurs et des fabricants.
Dans l’écosystème de notre client, quelques défis se posaient en matière de gestion et d’analyse des données. Différentes équipes utilisaient plusieurs outils, ce qui entraînait une collaboration réduite, des visions cloisonnées des données et des retards excessifs pour dépanner et corriger les problèmes. L’entreprise avait besoin d’une plus grande agilité dans la consommation des données et la prise de décision pour la planification et l’exécution dynamiques. Il était urgent de créer une plateforme de données centralisée permettant d’ingérer des données à partir de sources multiples.
Notre client a entrepris de moderniser sa plateforme de données et d’analytique. Dans le cadre du programme de modernisation de notre client, HCLTech a facilité la livraison de divers cas d’utilisation d’affaires, en mettant particulièrement l’accent sur la chaîne d’approvisionnement, grâce à l’utilisation de Azure Databricks Delta Lakehouse. Cela a permis non seulement d’améliorer la collaboration et le partage des données, mais aussi d’accélérer l’analyse avancée et les capacités d’intelligence d’affaires tout en assurant le respect des politiques de sécurité des données.
Le défi
Rationaliser l’analytique pour naviguer dans la complexité des données dans le commerce de détail
L’écosystème actuel de notre client comprenait plusieurs applications hébergées sur différents environnements infonuagiques et sur site. Voici quelques défis rencontrés :

- Manque de capacités d’analytique avancée et d’informatique décisionnelle : Notre client ne disposait pas des outils et de l’infrastructure nécessaires pour l’analytique avancée et l’informatique décisionnelle, ce qui nuisait à leur processus décisionnel
- Architecture infonuagique sous-optimale : Les incohérences dans la nomenclature et les pratiques de gestion de l’accès à la sécurité dans leur configuration infonuagique ont entraîné des inefficacités et des risques de sécurité potentiels
- Silos de données disparates : Les données étaient réparties entre différentes entités de l’organisation, ce qui menait à des vues fragmentées et nuisait à la collaboration
- Partage limité des données : Un paysage technique complexe rendait difficile le partage des données entre les différentes entités de l’organisation
- Niveau de maturité analytique variable : Les équipes présentaient des niveaux variables de maturité analytique, ce qui entraînait des structures de soutien et des résultats incohérents
- Provisionnement inefficace des données : Les équipes de données passaient beaucoup de temps à analyser des données cloisonnées dans plusieurs systèmes, ce qui retardait le développement d’informations
- Prise de décision incohérente : Les systèmes fragmentés empêchaient les utilisateurs de prendre des décisions éclairées, ce qui entraînait des incohérences dans les flux de travail et des reprises fréquentes
- Retards dans les solutions axées sur les données : L’augmentation du volume et de la complexité de l’information a entraîné des retards dans la création de prototypes et l’opérationnalisation de solutions axées sur les données
- Collaboration interfonctionnelle minimale : Le manque de collaboration entre les équipes interfonctionnelles a entraîné des méthodes de travail incohérentes et nui à la productivité
- Problèmes d’évolutivité : L’incapacité d’augmenter les ressources de stockage ou de calcul en raison de multiples pipelines ETL a nui à la capacité de l’organisation à gérer efficacement la croissance du volume de données
Azure Databricks Delta Lakehouse a été choisi pour son statut d’outil d’ingénierie des données infonuagique de premier plan pouvant répondre aux défis de notre client. Il a permis de traiter, transformer et explorer de grandes quantités de données en utilisant des modèles d’apprentissage automatique avec une approche axée sur la donnée comme produit.
L’objectif
Réaliser les avantages d’une plateforme de données connectée
Notre client visait à cultiver une culture axée sur le domaine des données afin d’améliorer la responsabilité et la productivité de l’analytique. Il cherchait à exploiter une plateforme moderne de données et d’analytique (D&A) pour offrir les données en tant que service, générant ainsi des perspectives et de la valeur. Les utilisateurs d’affaires étaient habilités à réutiliser des produits de données pour assurer la précision, afin d’appuyer la prise de décisions d’affaires. Leur objectif était d’établir un référentiel unique, en temps réel, de données dignes de confiance et organisées, dont la qualité est connue.
Databricks a été utilisé avec une approche agile pour tester, apprendre et générer de la valeur pour l’entreprise. Les utilisateurs souhaitaient se connecter aux entrepôts de données et éviter toute migration de données. En mettant en place Databricks, ils prévoyaient démocratiser l’accès aux données, séparer le stockage du calcul pour une évolutivité infinie, accroître l’agilité, gérer les coûts efficacement et éliminer les défis de gestion des données sans migration de données.

La solution
Transformer la gestion des données avec une plateforme D&A partagée et évolutive
La plateforme D&A partagée déployée selon une approche Data-Mesh, a instancié des domaines de données à partir de plans types, englobant des capacités clés pour la création de valeur à partir des données telles que le stockage, la surveillance, la gestion des clés, l’ELT, les moteurs analytiques et l’automatisation.
L’approvisionnement et la consommation de données sont classés en :
- Producteurs de données : Ceux-ci étaient responsables de fournir des ensembles de données gérés et de haute qualité, modélisés à partir d’entités de domaines d’affaires dans une couche organisée du lac de données
- Produits de données : Ceux-ci tirent parti des données des producteurs pour générer des résultats d’affaires

Cette plateforme a assuré une répartition précise de la propriété pour chaque producteur et a permis aux équipes de créer des rapports interactifs et dynamiques et d’utiliser les bibliothèques Spark pour le traitement des données, avec une capacité de calcul et de stockage évolutive. De nouveaux modèles d’apprentissage automatique et applications pouvaient être bâtis par-dessus Spark, en tirant parti de l’espace de travail intégré dans Databricks pour la collaboration dans un environnement multi-utilisateurs, la réutilisation de code et des flux de travail simplifiés. La fonction de gouvernance des données intégrée à Unity Catalog facilitait le contrôle d’accès centralisé, l’audit, la traçabilité et les capacités de découverte des données dans l’infrastructure de données d’entreprise.
L’impact
Utilisation de Databricks pour une intégration évolutive et une infrastructure de données optimisée
Databricks offre un environnement de production hautement évolutif, sécurisé et fiable dans le nuage. La plateforme fournissant Données en tant que service (DaaS) grâce à un modèle de service géré dans le nuage, accorde aux clients un accès transparent aux flux de données en temps réel, permettant ainsi aux entreprises d’opérer avec plus d’agilité. Les utilisateurs peuvent créer, déployer et gérer le cycle de vie complet des données dans le nuage. Les équipes peuvent effectuer l’exploration des données et interagir simultanément avec les données, tout en gérant, migrant, testant et assurant de façon autonome les déploiements, créant ainsi de l’autonomie.

- Analytique plus rapide
- Informations plus rapides : Dans Databricks, les informations étaient disponibles 30 fois plus rapidement qu’auparavant. Les données aplaties, imbriquées, structurées, non structurées et en temps réel ont permis aux utilisateurs de les analyser efficacement et de les convertir en représentations relationnelles pour en obtenir des insights précieux.
- Amélioration de la performance de traitement de 20x grâce à Spark : Databricks réduit considérablement le temps de traitement par lots en gérant les données structurées, non structurées, en temps réel et en ingérant à partir de stockages non traditionnels comme Oracle, SQL, SAP, etc.
- Plus sécuritaire
- Contrôle d’accès basé sur le rôle facilité par Unity Catalogue : Les utilisateurs disposent d’un contrôle d’accès basé sur les rôles, leur permettant d’interroger directement les données via une interface analytique virtuelle “facile à utiliser”. Ils peuvent accéder à chaque composant de l’infrastructure de données de l’entreprise, y compris les fichiers, grappes, code, déploiements d’applications, cache, tableaux de bord et rapports.
- Économies de coûts
- Efficacité accrue de 10 %-15 % et économies de coûts grâce à une approche de consolidation : L’augmentation de l’efficacité mène à des économies de temps et de coûts directes pour les tâches à grande échelle.
- Valeur ajoutée accrue avec 20 %-30 % de composants réutilisables : HCLTech a développé un portefeuille de composants et de modèles réutilisables pour l’ingestion, l’entreposage et la consommation de données, qui peuvent être utilisés dans différentes unités d’affaires afin d’augmenter la valeur livrée.
- Standardisation de la plateforme
- Plateforme de données unifiée : La plateforme Données et Analytique offre une solution de stockage unifiée, fiable et évolutive pour toutes les données de l’entreprise.
- Données comme produit : Les données sont traitées comme un actif de l’entreprise offert en tant que service, ce qui permet de réduire la duplication et de préparer les actifs de données organisées pour un usage à l’échelle de l’entreprise.
- Réalisation de la valeur d’affaires
- Prise de décisions clés : Les produits de données ont aidé les utilisateurs d’affaires à faire des prévisions prédictives, la détection de la demande, la gestion logistique et la gestion de la chaîne d’approvisionnement.
- Meilleure gouvernance (par chiffrement) : Les données sont classifiées et chiffrées selon leur sensibilité, ce qui garantit un accès sécurisé et approprié pour tous les utilisateurs.
