Évaluation automatisée de la qualité de l’IA avec HCLTech & Google Cloud

Automatiser l’évaluation de la qualité de l’IA avec HCLTech et Google Cloud

5 min de lecture

Un leader mondial du transport avec chauffeur et de la mobilité s'est associé à HCLTech et Google Cloud pour transformer la qualité de la génération de code basée sur l'IA. En tirant parti des modèles Gemini de Google, de l'ingénierie des invites et des cadres axés sur l'automatisation, HCLTech a aidé l'organisation à piloter une solution innovante pour évaluer les résultats des grands modèles de langage (LLM), améliorer l'évolutivité, renforcer la cohérence et réduire les efforts manuels dans l'assurance qualité du code IA.

Le défi

Évolutivité limitée du cadre d’évaluation de la qualité existant de l’IA
Validation manuelle longue et chronophage des réponses générées par un MLG
Application incohérente des paramètres de qualité rédactionnelle et de code selon les cas d'utilisation

L’objectif

Mettre à l’essai une solution automatisée pour évaluer les résultats des grands modèles linguistiques à grande échelle
Améliorer la cohérence et la fiabilité des évaluations de la qualité du code de l’IA
Réduire la charge opérationnelle grâce à l’automatisation et à l’évaluation intelligente
Jeter les bases des capacités d’assurance de l’IA à l’échelle de l’entreprise

La solution

Développement d'une solution de preuve de concept (PoC) utilisant les modèles Google Gemini afin d'automatiser l'évaluation des attributs de qualité d'écriture et de code
Mise en œuvre de techniques d'ingénierie d'invite et de sorties modélisées intégrées à Google Sheets pour l'analyse de traçabilité et la génération d’informations
Conception d’un cadre d’évaluation axé sur la qualité rédactionnelle (cohérence, troncation) et la qualité du code (clarté du langage, raisonnement)