Une feuille de route pour les paysages de données propulsés par l’IA

Comment déployer des technologies d’IA pour créer de la valeur à partir de vos données non structurées et identifier des améliorations de produits et de services.
5 min de lecture
Dr Andy Packham
Dr Andy Packham
Architecte en chef, vice-président principal, Unité de l’écosystème Microsoft, HCLTech
5 min de lecture
Une feuille de route pour les paysages de données propulsés par l’IA

Comment déployer des technologies d’IA pour créer de la valeur à partir de vos données non structurées et identifier des améliorations de produits et de services

Un paysage des données en mutation

La nature des données évolue, et par conséquent, le besoin de capacité de stockage s’accroît. IDC prévoit qu’en 2025, la capacité de stockage de données devra augmenter de 240 % (par rapport à 2020).1 Cependant, les types de données stockées évoluent aussi. Parallèlement aux données structurées (comme les données relationnelles et transactionnelles), on observe une montée fulgurante des données non structurées et semi-structurées. En fait, les analystes estiment que 80 % de toutes les données mondiales seront non structurées d’ici l’an prochain.1 Ce sont des chiffres stupéfiants.

Ce changement rapide de notre paysage de données, d’une concentration sur les données structurées—générées généralement par des applications d’entreprise centralisées telles que ERP et CRM—vers une approche permettant d’accueillir la croissance exponentielle du contenu et des données non structurées, a de profondes répercussions sur la façon dont nous pensons, gérons et extrayons la valeur de nos données. 

Contenu vs. données non structurées Même si le contenu et les données non structurées sont étroitement liés—et, en fait, le contenu peut contribuer aux données non structurées—ils ne sont pas synonymes. Le contenu fait référence à l’information mise à disposition pour la consommation finale, c’est-à-dire texte, images, vidéos et audio. Il peut contenir des éléments non structurés, mais inclut aussi des données structurées qui fournissent du contexte au contenu, comme les métadonnées. Essentiellement, si tout contenu peut être considéré comme des données (structurées ou non structurées), toutes les données non structurées ne sont pas du contenu; c’est une catégorie plus vaste englobant d’autres types de données non liés au contenu.

Le pouvoir des données non structurées Les données non structurées sont cruciales. Elles peuvent potentiellement ajouter de la valeur à de nombreux points de contact de votre entreprise en générant de nouveaux éclairages sur la façon dont vos clients se comportent, consomment et interagissent avec les produits et services. Toutefois, ce type de données provient généralement de sources de contenu diverses qui n’entrent pas dans un schéma de base de données standard, telles que des fichiers texte, images, vidéos, publications sur les médias sociaux et courriels, parmi d’autres communications. Contrairement aux données structurées qui peuvent être organisées proprement en lignes et colonnes, celles issues de ces sources n’ont pas de formats prédéfinis—ce qui les rend complexes, désordonnées et de qualité variable—et donc plus difficiles pour établir des corrélations et des tendances. 

Ces caractéristiques distinctives, ainsi que la taille considérable des données non structurées, signifient qu’une stratégie différente et réfléchie s’impose pour en extraire de l’information pertinente. Des techniques spécialisées de traitement et d’analyse, telles que les algorithmes d’, le traitement du langage naturel (NLP) et des modèles d’analyse de données, sont souvent nécessaires.

La croissance rapide des données non structurées a été accompagnée par une croissance rapide des technologies d’IA. Ceci a modifié la délimitation des frontières traditionnelles entre données et analytique, et a ouvert de nouvelles façons de débloquer la valeur.

Une approche hybride maximise la valeur des données Les données non structurées influencent désormais de façon significative notre architecture de données, alors que pouvons-nous faire pour exploiter leur potentiel ? Le défi, c’est de parvenir à valoriser ces données—en particulier les éclairages liés au comportement humain—et à les combiner avec des ensembles de données traditionnels pour libérer une valeur plus étendue à l’échelle de l’entreprise.

Les données structurées et non structurées sont fondamentalement différentes. S’appuyer sur une approche traditionnelle ne fonctionnera pas. HCLTech et Microsoft ont élaboré ce plan d’action pour vous aider à élaborer une stratégie de données moderne, prête pour l’IA, qui vous permettra d’aller rapidement et de manière pragmatique au-delà de la preuve de concept afin d’obtenir des résultats favorisant la croissance. 

Plan d’action pour gérer les données non structurées et déployer l’avantage IA à grande échelle

La combinaison des capacités d’ingénierie éprouvées de HCLTech et des évolutives offertes par vous permet de tirer en toute confiance de la valeur d’affaires de vos données. Utilisez notre feuille de route pour vous guider dans ce parcours.

  1. Adoptez une nouvelle façon de penser

    Un travail de désapprentissage peut s’avérer nécessaire pour monétiser les données non structurées. Au sein de votre organisation, vous êtes à l’aise avec les données structurées et leur format, mais adopter un processus visant à convertir les données non structurées dans une convention structurée est à la fois coûteux et inefficace. Évitez de penser à réunir toutes vos données non structurées dans un dépôt unique  des technologies comme Microsoft Fabric existent déjà pour exploiter le potentiel des données à grande échelle.

    En tant que plateforme intégrée de gestion de données qui consolide différents types de données au sein d’une architecture de lakehouse centralisée, Microsoft Fabric permet de faciliter une analytique complète des données. En tirant parti d’outils avancés d’intégration et de traitement des données, les entreprises peuvent réaliser des analyses de données approfondies pour orienter la prise de décision grâce à des algorithmes sophistiqués d’IA et d’apprentissage automatique. L’intégration de la gouvernance des données dans la gestion des données non structurées est essentielle pour assurer le respect des normes de qualité, demeurer sécuritaires et respecter les réglementations applicables. Microsoft Fabric soutient cette gouvernance robuste en fournissant des outils et des cadres qui aident à définir les contrôles d’accès, à catégoriser les données et à maintenir leur intégrité. Cela protège non seulement les données, mais en accroît aussi la valeur pour l’intelligence d’affaires et la prise de décision.

    Penser autrement vous permettra de devenir une organisation davantage orientée données.

    Exemple d’utilisation

    Les organisations qui offrent des services rapides et destinés au grand public doivent extraire des connaissances exploitables à partir d’une vaste gamme de sources de données, dont les médias sociaux, du texte, des applications et des courriels, pour offrir leurs services de façon optimale en quasi temps réel et déceler les tendances susceptibles d’influencer leur stratégie à long terme. Des analyses propulsées par l’IA sont déployées pour extraire de la valeur à partir de données non structurées sans devoir les formater ou les organiser.

  2. Commencez par un cas d’utilisation ou un enjeu d’affaires

    Comprendre l’étendue, l’état et le potentiel de l’ensemble de l’écosystème de données de votre organisation est une tâche colossale. Il vaut mieux commencer par nommer l’enjeu d’affaires que vous souhaitez résoudre, puis identifier les données dont vous aurez besoin pour y parvenir. Désirez-vous améliorer l’expérience client ? Ou trouver comment améliorer les sites à partir de l’engagement client ? Cette approche efficiente et rentable optimise l’allocation des ressources, car seuls les cas de preuve de concept pouvant offrir les retombées attendues feront foi de démonstration. 

    Microsoft Fabric vous permet d’y parvenir en offrant la possibilité à votre entreprise de commencer petit, puis de mettre à l’échelle vos capacités de gestion de données au besoin. Il propose un mode de tarification à l’utilisation, ce qui signifie que les entreprises ne paient que pour la capacité consommée—sans nécessiter de lourds investissements initiaux. Cette flexibilité permet aux organisations d’adapter leurs opérations de données à la demande en temps réel, assurant ainsi l’efficience des coûts et l’adaptabilité aux besoins évolutifs—en évitant également des investissements CAPEX d’envergure avant d’en constater la valeur d’affaires.

    Exemple d’utilisation

    L’utilisation de l’analytique vidéo issue de caméras de sécurité en magasin afin de comprendre les mouvements dans le magasin permet d’optimiser l’aménagement, l’espacement des allées et l’emplacement des caisses pour accroître l’expérience globale du consommateur dans une chaîne de détaillants. Le point de départ du projet consistait à augmenter l’implication du client dans l’environnement de vente au détail pour stimuler les ventes.

  3. Distinguez selon les coûts et la valeur future

    Le volume de données non structurées est important; il faut donc optimiser le stockage. Les entreprises devraient adopter une double stratégie qui détermine quelles données peuvent présenter une valeur immédiate et quelles données pourraient avoir une valeur future. Toutes les données utiles pour l’objectif d’affaires doivent être exploitées, tandis que celles qui présentent un potentiel futur doivent être stockées de manière économique. Cette distinction est essentielle pour optimiser l’entreposage tout en conservant le potentiel de valeur d’affaires. 

    Exemple d’utilisation

    En visant à créer une expérience d’achat plus personnalisée, une chaîne de magasins a pu croiser des résultats issus de l’analytique vidéo réalisée auparavant sur la disposition des magasins et le comportement client avec, plus tard, les données du programme de fidélité, afin de découvrir de nouvelles possibilités d’amélioration.

  4. Utilisez le croisement de données pour maximiser la valeur

    Rassembler plusieurs ensembles de données sous divers formats est essentiel pour dégager une plus grande valeur. Les données non structurées fournissent des informations précieuses sur les comportements humains, tant à l’échelle individuelle que macro. La combinaison de sources d’information plus inhabituelles, telles que les activités générées sur les médias sociaux, avec vos données d’affaires existantes, telles que les points de vente et la surveillance des stocks, génère une vue plus globale de ce qui se passe dans votre organisation. C’est à l’intersection des données structurées et non structurées que s’opère la véritable transformation d’entreprise. 

    Exemple d’utilisation

    Une organisation observe une hausse des ventes au cours des six premiers mois de l’année et base ses prévisions d’inventaire et de performance financière sur ses systèmes de point de vente. L’augmentation prévue ne se réalise pas, la compagnie se retrouve avec des stocks invendus et des ventes en baisse. Elle a omis de tenir compte des avis clients qui signalaient un problème de qualité produit et une hausse exponentielle du mécontentement. Recouper une plus grande variété de données aurait mené à de meilleures décisions.

  5. Maintenez la qualité, la gouvernance et la sécurité

    Les principes de gestion des données non structurées demeurent les mêmes. Utilisez les technologies disponibles pour résoudre les problèmes de qualité des données  par exemple, le bruit de fond et la mauvaise qualité audio — afin d’augmenter significativement la valeur d’utilisation. Le respect de la vie privée est essentiel. La combinaison des données provenant des médias sociaux et des centres d’appels nécessite des filtres pour retirer les renseignements personnels identifiables (RPI) et les détails sensibles. La gouvernance permet d’assurer le respect des exigences réglementaires et organisationnelles.

    Microsoft Fabric simplifie la gestion et la sécurisation des données. Il permet aux entreprises de catégoriser l’information au moyen de balises de données. Les fonctions de sécurité de la plateforme garantissent que les données sont protégées et accessibles uniquement au personnel autorisé, assurant ainsi la confidentialité et la conformité aux normes du secteur.

    Exemple d’utilisation

    La réduction du gaspillage est cruciale alors que l’approvisionnement mondial en eau potable diminue. En regroupant les données de flux en temps réel des conduites, les activités sur les médias sociaux et les interactions au centre d’appels, une grande compagnie d’eau peut dorénavant trianguler plus rapidement une fuite ou une panne, et la régler plus efficacement. L’introduction des données issues des médias sociaux fut cruciale pour hâter la réponse—les consommateurs utilisent ce média comme premier point de contact, devant les centres d’appels—mais il a fallu mettre en place des filtres de confidentialité très stricts.

Écoutez HCLTech et Microsoft en discussion ici

Prendre des décisions d’affaires plus précises

L’accès aux données non structurées procure des informations comportementales précieuses permettant d’offrir de meilleurs produits et services, tant en temps réel qu’à long terme. Chez HCLTech, nous misons sur une approche pragmatique de la modernisation des données. Nous combinons notre capacité d’ingénierie éprouvée avec les technologies évolutives de Microsoft afin que votre infrastructure de données et d’analytique soit entièrement prête pour l’IA.

  1. https://www.red-gate.com/blog/database-development/whats-the-real-story-behind-the-explosive-growth-of-data
  2. https://zapier.com/blog/structured-vs-unstructured-data/
Partager sur
Nuage et écosystème Nuage Blogues Une feuille de route pour les paysages de données propulsés par l’IA