Comme mentionné dans un épisode récent du balado HCLTech Tendances et Perspectives, le monde de l'entreprise passe du stade de la preuve de concept à l'adoption réelle de l'IA générative (GenAI). Govind Chandranani, chef de la pratique Ingénierie et Services de R-D chez HCLTech, observe que le marché a maintenant « d’énormes attentes… concernant le rôle de la GenAI tant pour la transformation des affaires que des services. » En effet, les leaders de tous les secteurs y voient un potentiel dans l’IA générative – mais ils font également face à de nouveaux défis.
Les risques varient selon le secteur. Dans les industries axées sur les consommateurs, la confidentialité est un enjeu majeur et ceux-ci craignent que la GenAI puisse compromettre la vie privée individuelle. Dans le commerce de détail ou la finance, cela signifie que les consommateurs et les organismes de réglementation examineront de près comment les données sont recueillies et utilisées dans les modèles d’IA.
Chandranani souligne comment ce risque touche la réputation de marque : « Ces nouveaux chatbots représentent l’entreprise, » explique-t-il, ajoutant que « nous avons vu des exemples où quelqu’un a demandé un remboursement à une compagnie aérienne et l’entreprise a dû dire : “Nous ne fournirons pas ce que le chatbot avait promis.” » Lorsque l’IA fait des promesses au nom d’une marque, les hallucinations ne sont plus seulement des problèmes techniques. Elles peuvent devenir des responsabilités.
En soins de santé, les enjeux incluent la sécurité des patients et la conformité réglementaire. Des experts mettent en garde que des résultats biaisés de l’IA pourraient mener à des diagnostics ou des recommandations de traitement inexacts et des erreurs de diagnostic. Comme les données de santé sont hautement sensibles, les fournisseurs doivent s’assurer que les outils GenAI répondent à des normes strictes, telles que HIPAA et la validation clinique.
De même, les organisations manufacturières ou d’ingénierie doivent équilibrer le coût du déploiement de modèles IA puissants avec le besoin d’explicabilité et de sécurité. Chandranani note que dans des secteurs verticaux comme la fabrication ou la santé, « le risque se situe au niveau du coût et de la précision des modèles, pas seulement l’exactitude des réponses, [mais si le modèle fait bien ce que l’on souhaite, selon la politique]. »
Ces risques sectoriels ne sont pas hypothétiques. Par exemple, une récente affaire devant un tribunal américain a mis en évidence le danger des hallucinations d’IA non contrôlées : des avocats ayant utilisé ChatGPT ont fini par citer dans leurs argumentaires une jurisprudence fictive, entraînant des sanctions. Ce type de situation montre qu’une simple erreur de l’IA peut enfreindre les règles de conformité ou ébranler la confiance du public, surtout dans des secteurs réglementés. Les dirigeants doivent donc évaluer la GenAI sous l’angle des risques propres à leur domaine : de la confidentialité des données et de la PI dans les applications de consommation jusqu’au coût, à l’explicabilité et à la sécurité dans la santé et la fabrication.
Repenser l’assurance qualité : une nouvelle approche des tests
Contrairement aux logiciels traditionnels, les résultats de la GenAI ne sont pas entièrement prévisibles. Même un même énoncé peut produire chaque fois différentes réponses valides. Les équipes AQ doivent abandonner l’ancienne mentalité du « une seule bonne réponse ».
Chandranani insiste sur ce changement : « Il faut créer des invites pour pousser le système à ses limites, » dit-il. « Il faut une plus grande base de connaissances pour générer la bonne invite qui correspond à l’IA responsable, à la fonctionnalité de votre domaine et à vos [attentes] de performance. » Il ajoute qu’une approche entièrement manuelle n’est pas suffisante : « Les tests GenAI ne peuvent pas être totalement manuels. Sinon, cela va induire le système en erreur. »
Au lieu d’attendre une précision rigide, les testeurs doivent travailler dans un cadre basé sur la confiance : ils ajustent, évaluent et surveillent le comportement de l’IA comme ils le feraient avec un nouvel employé. En pratique, cela veut dire bâtir des suites de tests itératives et des bibliothèques d’invites pour sonder les réponses du modèle, en utilisant des mesures allant au-delà de la simple exactitude, dont la cohérence factuelle, le score de biais et la diversité des réponses.
Chandranani souligne que « la validation continue est très importante. » Sans cela, des données biaisées ou désuètes produiront des résultats faussés. En effet, des chercheurs notent que les mesures de précision traditionnelles « ne saisissent pas la vulnérabilité des LLM aux facteurs provoquant des hallucinations, » si bien que de nouveaux critères d’évaluation, tels que les taux d’hallucination et la robustesse aux variations d’invite, doivent être ajoutés. En passant consciemment d’un « résultat exact » à une « plage de résultats acceptables », l’AQ peut aider à s’assurer que les systèmes GenAI se comportent de façon fiable même s’ils apprennent ou dérivent avec le temps.
Piliers d’une IA fiable et responsable
La gestion des risques commence à la conception. Chandranani précise que les organisations devraient intégrer « une IA fiable et responsable » dès le départ. Cela signifie respecter des piliers fondamentaux comme la transparence, la responsabilisation et l’explicabilité.
Comme l’indique le Cadre de gestion des risques de l’IA du NIST, les systèmes IA fiables doivent être valides et fiables, sûrs, sécurisés et résilients, responsables et transparents, explicables et interprétables, axés sur la confidentialité et équitables – tout en maîtrisant les biais préjudiciables. En termes pratiques, cela se traduit par la documentation complète des sources de données et des processus d’apprentissage, le maintien de journaux d’audit des décisions de l’IA et la fourniture d’explications lisibles aux humains pour les résultats au besoin.
Chandranani souligne l’urgence concrète : « Supposons que vous demandez à un chatbot : ‘Vais-je obtenir un remboursement ?’ et qu’il répond oui selon sa mémoire récente. Cela signifie que votre [système] n’est pas assez responsable. » Dans un système complexe, il est important de pouvoir démontrer comment le modèle parvient à ses résultats ou réponses.
Pour les hauts dirigeants, cela signifie aussi instaurer des politiques de gouvernance, incluant des audits de biais et des examens éthiques, pour qu’aucun système ne soit traité comme une boîte noire. Par exemple, la propre plateforme d’ingénierie IA de HCLTech, AI Force, intègre désormais des analyseurs de sécurité des entrées et de sorties pour signaler tout contenu potentiellement dangereux ou sensible avant qu’il n’atteigne les utilisateurs finaux.
Comme l’explique Chandranani : « Nous avons créé un système capable de générer des milliers d’invites très rapidement et de fournir des matrices objectives, de sorte que chaque [ingénieur en validation ou] expert du domaine pense de façon semblable. Cela améliore l’objectivité, la précision et la [future] explicabilité. » Ce système de garde-fous assisté par outil démontre comment la responsabilisation et l’explicabilité peuvent être opérationnalisées : les recommandations des modèles sont automatiquement validées et tout problème signalé peut être retracé à des entrées précises.
Impératifs réglementaires : conformité ou avantage concurrentiel
Les gouvernements du monde entier sont en train de rattraper la réalité de l’IA. La loi européenne sur l’IA, par exemple, constitue « le tout premier cadre juridique pour l’IA » et impose des règles strictes, axées sur les risques, pour le déploiement. L’IA à haut risque (dans des domaines comme les dispositifs médicaux, la sélection d’employés ou l’identification biométrique) nécessitera des évaluations de risques rigoureuses, une utilisation transparente des données, une supervision humaine et une précision démontrée. Pendant ce temps, aux États-Unis, le NIST a publié un Cadre de gestion des risques de l’IA (AI RMF) qui, bien que volontaire, recommande aux entreprises de cartographier, gérer et mesurer les risques liés à l’IA en fonction des mêmes facteurs de confiance.
Les échéances de conformité approchent, alors les dirigeants doivent se préparer proactivement. Chandranani note qu’il faut examiner deux aspects : « d’abord, vos politiques internes ; ensuite, votre conformité légale, selon votre secteur ou votre emplacement. » Il ajoute que bâtir une fois ne suffit pas : « Il faut gouverner de façon continue. »
Les entreprises apprennent que l’adoption précoce de la gouvernance IA peut être un facteur différenciateur stratégique. Une étude HCLTech révèle que même si la plupart des organisations reconnaissent l’importance de l’IA responsable, seulement 15 % sont très bien préparées à appliquer les meilleures pratiques, peu d’entre elles étant réellement prêtes à déployer la GenAI de manière responsable et à transformer la conformité en avantage concurrentiel.
Gouvernance interfonctionnelle et indicateurs clés de performance
La qualité de la GenAI n’est pas qu’un enjeu technique, c’est un enjeu organisationnel. Les déploiements réussis nécessitent une collaboration interfonctionnelle entre les équipes affaires, juridiques, données et ingénierie.
« On entraîne le modèle, on le règle, on le teste, on le surveille continuellement et on revient à la phase de mise à jour. Tant de rôles sont impliqués. Voilà pourquoi une collaboration équitable est nécessaire, » souligne Chandranani.
Des KPI clairs et des mesures permettent de réunir ces groupes. Les indicateurs traditionnels comme la disponibilité ou la latence doivent être complétés par des indicateurs propres à l’IA, comme le taux d’hallucination, la cohérence des réponses et les scores d’explicabilité. « Cela devient la communication entre les équipes, » poursuit Chandranani. « Si je crée 1 000 invites et les cartographie à des matrices quantifiables, ces mêmes données peuvent être utilisées par les concepteurs, développeurs et testeurs. »
En s’entendant sur ces nouveaux « KPI IA » dès le départ, des équipes multidisciplinaires peuvent surveiller la santé du pipeline GenAI de bout en bout – de l’ingestion des données à la sortie du modèle et à l’incidence sur l’entreprise.
Surveillance continue et validation structurée
Finalement, le déploiement de la GenAI en production n’est pas un projet ponctuel, mais un processus continu. Une fois en production, les modèles doivent être surveillés en continu pour la dérive, la sûreté et la performance.
La plateforme AI Force de HCLTech facilite cela. « Nous avons bâti [ce système] pour permettre aux ingénieurs de validation, devOps LLM, développeurs et experts de domaine d’obtenir des données très objectives, [ce qui donne] une meilleure précision, une objectivité accrue et une meilleure explicabilité, » dit Chandranani.
L’objectif est d’établir un pipeline de validation structuré : avant toute mise à jour de modèle, il doit passer des contrôles de qualité, comme des tests de précision, des audits d’équité et des vérifications de sécurité. On peut voir cela comme de l’intégration et déploiement continus (CI/CD) pour l’IA, chaque modification de code ou de données devant franchir un examen standardisé. Cette approche soutenue par des outils permet non seulement de faire évoluer les efforts d’AQ, mais aussi d’apporter la preuve vérifiable de la diligence raisonnable.
Sans compromis
Réaliser la promesse de la GenAI exige un équilibre entre agilité et rigueur. « Ce ne sont pas seulement des risques, ce sont des défis. Et en tant qu’entreprise TI, nous devons y répondre pour offrir une bonne expérience client, » dit Chandranani.
En identifiant les risques propres à chaque secteur, en adoptant une nouvelle approche des tests, en respectant des piliers éthiques fondamentaux, en anticipant sur la réglementation et en investissant dans des processus et outils transversaux et de surveillance, les entreprises peuvent exploiter la GenAI de manière sécuritaire et efficace.
Le résultat sera des produits innovants propulsés par l’IA qui ravissent les clients, sans compromettre la confiance ou la conformité.



