Automatiser l’évaluation de la qualité de l’IA avec HCLTech et Google Cloud
Un leader mondial du transport avec chauffeur et de la mobilité s'est associé à HCLTech et Google Cloud pour transformer la qualité de la génération de code basée sur l'IA. En tirant parti des modèles Gemini de Google, de l'ingénierie des invites et des cadres axés sur l'automatisation, HCLTech a aidé l'organisation à piloter une solution innovante pour évaluer les résultats des grands modèles de langage (LLM), améliorer l'évolutivité, renforcer la cohérence et réduire les efforts manuels dans l'assurance qualité du code IA.
Le défi
- Évolutivité limitée du cadre d’évaluation de la qualité existant de l’IA
- Validation manuelle longue et chronophage des réponses générées par un MLG
- Application incohérente des paramètres de qualité rédactionnelle et de code selon les cas d'utilisation

L’objectif
- Mettre à l’essai une solution automatisée pour évaluer les résultats des grands modèles linguistiques à grande échelle
- Améliorer la cohérence et la fiabilité des évaluations de la qualité du code de l’IA
- Réduire la charge opérationnelle grâce à l’automatisation et à l’évaluation intelligente
- Jeter les bases des capacités d’assurance de l’IA à l’échelle de l’entreprise


La solution
- Développement d'une solution de preuve de concept (PoC) utilisant les modèles Google Gemini afin d'automatiser l'évaluation des attributs de qualité d'écriture et de code
- Mise en œuvre de techniques d'ingénierie d'invite et de sorties modélisées intégrées à Google Sheets pour l'analyse de traçabilité et la génération d’informations
- Conception d’un cadre d’évaluation axé sur la qualité rédactionnelle (cohérence, troncation) et la qualité du code (clarté du langage, raisonnement)

L'impact
- Réduction de 20 % du temps de validation humaine
- Augmentation de 20 % du débit global d'évaluation
- Amélioration de 15 % de la cohérence des paramètres de qualité appliqués
- Économies opérationnelles de 15 % grâce à l’automatisation par l’IA

