Databricks libère des informations précieuses, permet une prise de décision basée sur les données
Aperçu
Notre client figure parmi les plus grands fournisseurs de services de télécommunication aux États-Unis, offrant un large choix de téléphones intelligents, d’accessoires et de routeurs à large bande pour la maison. Auparavant, il s’appuyait sur de multiples sources de données, numériques et non numériques, pour l’analytique des données et la production de rapports. Les analystes agrégeaient manuellement ces informations pour créer des tableaux de bord personnalisés selon les besoins des utilisateurs d’affaires. Notre client souhaitait réduire les coûts d’acquisition et de consolidation des données en raison de la diversité et de la complexité des sources.
HCLTech a mis en œuvre une plateforme intelligente de données Databricks qui a fourni une interface unifiée pour l’ingestion de données provenant de différentes sources, tout en assurant la maintenance applicative transparente et la gestion des données. Les outils ETL intégrés à la plateforme ont offert automatisation et évolutivité. Les flux de travaux Databricks ont amélioré la rapidité, l’efficacité, la précision et la flexibilité, et ont permis d’obtenir des informations à un coût plus compétitif. HCLTech a conçu un pipeline générique d’ingestion de données qui s’est intégré à Adobe Experience Platform (AEP) et à d’autres sources sur Databricks Lakehouse. Avec Databricks, nos clients ont pu gérer plus efficacement les tâches de production de rapports et d’audit grâce aux notebooks Databricks, où les scripts SQL et Python s’intègrent sans problème avec SPARK. Cela a permis au client de gérer de grandes quantités de données afin de faire de l’analytique et de bâtir des modèles pour une prise de décision éclairée.
Le défi
Migration des données de plateformes isolées vers une architecture cloud moderne et unifiée de données ouvertes
Notre client utilisait auparavant plusieurs plateformes de données infonuagiques pour l’analyse, nécessitant des compétences spécifiques pour gérer les charges de travail de données. De plus, il existait des silos de données qui compliquaient davantage l’exécution des tâches d’analyse limitées dans le temps. Les autres défis comprenaient :

- L'intégration de nouvelles sources de données provenant de multiples systèmes sources prenait beaucoup de temps.
- Auparavant, notre client manquait les échéances pour des événements limités dans le temps (lancement de nouveaux produits sur le marché et modification des segments de suivi des utilisateurs sur le site web), ce qui entraînait un délai de mise en marché plus élevé.
- Il n’y avait pas de plateforme de données unifiée avec une méthode standardisée pour présenter les données traitées.
- Le cadre récurrent de validation manuelle des données était inefficace et chronophage.
- Hausse des coûts en raison des processus manuels. Il y avait un besoin urgent d’inclure l’automatisation pour intégrer les silos de données.
- Plusieurs sources de données pour l’ingestion (nécessaires à l’analyse) manquaient de normes de gouvernance des données.
L’objectif
Optimisation des coûts, automatisation et gestion simplifiée des données grâce à la plateforme intelligente de données Databricks
En l’absence d’un schéma de référence identifié pour les différentes sources de données, l’objectif principal de notre client était d’utiliser une plateforme unifiée qui offrait une interface commune pour l’ingestion de différentes sources de données. De plus, leurs équipes des ventes, du marketing et des finances voulaient surveiller la performance des ventes et des campagnes marketing et obtenir des informations en temps opportun durant les lancements de produits afin de suivre le comportement d’achat des clients et de se préparer pour le prochain lancement de produit. Enfin, ils cherchaient à optimiser leurs coûts liés à l’embauche de ressources qualifiées pour gérer de multiples sources de données.

La solution
HCLTech a livré une plateforme de données unifiée pour une prise de décision éclairée
HCLTech a mis en œuvre la Databricks Data Intelligent Platform afin de fournir des solutions de migration de données au client. L’interface de la plateforme unifiée a permis l’intégration de différentes sources de données sans aucun effort de redéveloppement. Elle a permis une maintenance d’applications fluide et a pris en charge les tâches de gestion des données, y compris l’intégration, la gestion des métadonnées, les flux de travail automatisés, l’analytique et la visualisation des tableaux de bord. Les outils ETL intégrés ont permis une extraction, une transformation et un chargement des données efficaces, tout en offrant l’automatisation et l’évolutivité.
HCLTech a conçu un pipeline générique d’ingestion de données pour la plateforme Adobe Experience Platform (AEP) et d’autres sources de données sur Databricks Lakehouse qui pouvaient être configurés pour se connecter à n’importe quelle source de données tout en effectuant dynamiquement des transformations et l’ingestion dans le système cible Databricks Lakehouse. Nous avons créé des modèles de données comme la détection d’anomalies pour une prise de décision éclairée. Cela a permis à notre client d’analyser le comportement des clients sur le site Web du client pour effectuer des analyses de ventes et de marketing.
La plateforme personnalisée construite par HCLTech pouvait effectuer des contrôles de validation dans Databricks pour garantir la qualité des données comportementales des utilisateurs. La détection d’erreurs était effectuée automatiquement depuis le système source grâce à des notifications push. Nous avons construit des tableaux de bord de rapports en libre-service afin de fournir de meilleures informations aux utilisateurs d’affaires tout en chiffrant les renseignements personnels identifiables (PII). La surveillance planifiée du tableau de bord d’état du pipeline a également permis le suivi du processus ETL.
Notre client a apprécié les avantages de la source de données unifiée de Databricks et son architecture de lakehouse, qui combine les fonctionnalités des entrepôts de données et des lacs de données. Avec Databricks, nos clients pouvaient gérer plus efficacement les tâches de rapports et d’audit en utilisant les carnets Databricks, où les scripts SQL et Python pouvaient être intégrés sans problème avec SPARK.

L’impact
La transition vers Databricks a aidé notre client à réaliser des gains d’efficacité et de performance en 90 jours
HCLTech a recommandé la plateforme intelligente de données Databricks pour sa capacité intégrée à effectuer des analyses précises.

- Databricks a contribué à une efficacité accrue de 70 % à 80 % en matière de temps et de coûts
- Augmentation de 2 à 3 fois de la précision, de la prise de décisions et de la performance avec l’implantation de Delta Lake sur Databricks
- Des rapports 2 à 3 fois plus rapides pouvaient être créés grâce à Databricks en automatisant les flux de travail et en construisant des pipelines génériques
- En tirant parti de l’architecture infonuagique, ils ont pu traiter des millions de dossiers en quelques heures seulement grâce à l’architecture de lac de données de Databricks, comparativement aux jours ou semaines auparavant nécessaires pour des rapports manuels avec d’autres outils
- La transition vers Databricks Delta Lake a permis une réduction des coûts de 2 à 3 fois en consolidant les données organisationnelles
