Ingénierie des invites : Valeur de l’IA générative

L'ingénierie d'invite : La passerelle pour extraire de la valeur de l’IA générative

Exploiter pleinement la puissance de l’IA générative nécessite les bons prompts ou questions, c’est pourquoi l’ingénierie des prompts est devenue une discipline essentielle pour l’avenir de l’innovation

Août 9, 2023

13 minutes de lecture

Nicholas Ismail

Global Head of Brand Journalism, HCLTech

Août 9, 2023

13 minutes de lecture

Listen à article

30s Backward

0:00 0:00

30s Forward

L’IA générative, ou GenAI, est perçue au même niveau que certaines des plus grandes avancées technologiques disruptives du monde.

Mais tout comme la machine à vapeur avait besoin d’un humain pour la conduire et alimenter la chaudière en charbon, l’IA générative a besoin d’ingénieurs en prompts pour obtenir les bons résultats.

Qu’est-ce qu’un ingénieur en prompts ?

L’ingénierie des prompts désigne l’art et la science de formuler des instructions ou des requêtes précises afin d’obtenir les résultats souhaités des modèles d’IA générative. Cela est crucial, car selon la façon dont quelqu’un rédige une requête, les résultats varient grandement. Un ingénieur en prompts est nécessaire pour concevoir et façonner avec soin le comportement des modèles de langage, comme ChatGPT, afin de garantir des interactions fiables – c’est important pour contrôler la qualité des réponses, améliorer leur pertinence, éviter les biais et optimiser l’expérience des utilisateurs avec ces modèles d’IA de nouvelle génération.

Le rôle d’ingénieur en prompts existe depuis un certain temps déjà, mais aujourd’hui, grâce à la montée en puissance de l’IA générative, c’est désormais l’un des postes technologiques les plus recherchés au monde, souvent avec un salaire à six chiffres.

Lors du Forum économique mondial à Davos 2023, le professeur Erik Brynjolfsson, directeur du Digital Economy Lab à l’Université Stanford, a déclaré : « À l’heure actuelle, il serait tout simplement dangereux d’utiliser [des programmes d’IA générative] sans un humain dans la boucle, mais je pense qu’à l’avenir, nous allons créer un nouveau métier, celui d’ingénieur en prompts. »

Il a poursuivi : « Vous en entendrez tous parler bientôt. L’ingénierie des prompts, c’est l’idée que lorsque vous travaillez avec l’un de ces grands modèles linguistiques, vous pouvez rédiger différents types de requêtes et il se trouve que selon la façon dont vous rédigez la requête, vous obtenez des résultats dramatiquement différents.

« Même les inventeurs de ces technologies sont surpris de certaines des choses que vous pouvez leur faire faire si vous posez la question de la bonne manière. »

Techniques d’ingénierie des prompts

L’ingénierie des prompts a rapidement évolué pour devenir une discipline à part entière de l’IA. Aujourd’hui, des chercheurs et des praticiens ont développé des techniques sophistiquées et des méthodologies pour optimiser les prompts afin d’obtenir les résultats souhaités, sans biais.

Plusieurs techniques sont adoptées, dont l’ajustement fin (fine-tuning), la génération zéro-exemple (zero-shot), l’exemple unique (one-shot) et la chaîne de raisonnement (CoT, Chain of Thought).

1. Ajustement fin (Fine-tuning)

L’ajustement fin peut améliorer la performance et la pertinence des réponses d’un modèle d’IA. Pour cela, les modèles de langage déjà formés sur de grands ensembles de données sont affinés avec des tâches ou des domaines spécifiques. Cela permet aux ingénieurs d’adapter les modèles afin qu’ils puissent répondre à des prompts particuliers dans différents contextes.

« Fondamentalement, l’ingénierie des prompts consiste à amener le modèle à faire ce que vous voulez au moment de l’inférence en fournissant suffisamment de contexte, d’instructions et d’exemples sans modifier les poids sous-jacents. L’ajustement fin, en revanche, consiste à faire la même chose, mais en mettant à jour directement les paramètres du modèle à l’aide d’un ensemble de données représentant la distribution des tâches que vous souhaitez qu’il accomplisse », écrit Niels Bantilan, ingénieur ML en chef chez Union.ai, dans un billet de blogue récent.

2. Zero-shot

Technique émergente, le zero-shot consiste à créer un prompt auquel le modèle d’IA peut répondre ou qu’il peut accomplir sans données d’entraînement préalables. Le zero-shot consiste à laisser le jugement au LLM, en supposant qu’il est déjà entraîné et prêt à répondre à votre question précise. La plupart des exemples que j’ai vus pour le zero-shot sont qualitatifs.

Pour comprendre pourquoi cela est utile, le chercheur principal et fondateur de Machine Learning Mastery explique: « Imaginez le cas de l’analyse de sentiments: vous pouvez prendre des paragraphes aux opinions différentes et les étiqueter avec une classification de sentiment. Ensuite, vous pouvez entraîner un modèle d’apprentissage automatique (par ex., un RNN sur les données textuelles) pour prendre un paragraphe comme entrée et générer une classification en sortie. Mais vous verrez qu’un tel modèle n’est pas adaptatif. Si vous ajoutez une nouvelle classe à la classification ou demandez de ne pas classer le paragraphe mais de le résumer, ce modèle doit être modifié et réentraîné.

« Un grand modèle linguistique, cependant, n’a pas besoin d’être réentraîné. Vous pouvez demander au modèle de classifier un paragraphe ou de le résumer si vous savez comment bien le formuler. Cela signifie que le modèle ne peut probablement pas classifier un paragraphe dans les catégories A ou B, car le sens de “A” et “B” n’est pas clair. Il pourra toutefois classifier selon “sentiment positif” ou “sentiment négatif” car le modèle connaît la signification de ces mots. Cela fonctionne parce que, durant l’entraînement, le modèle a appris le sens de ces mots et acquis la capacité de suivre des instructions simples. »

En termes simples, les utilisateurs peuvent demander à l’algorithme de classifier le texte suivant en neutre, négatif ou positif. Texte : Raja prévoit de partir en vacances Sentiment : Neutre <Sortie>

À l’avenir, il y a des risques à laisser le LLM décider, mais les progrès du zero-shot pourraient permettre aux modèles d’IA de fournir des résultats pour diverses tâches avec un minimum de données, ce qui est utile étant donné la rareté des données de bonne qualité.

3. One-shot

Le one-shot consiste à apprendre au LLM à faire quelque chose en une seule étape. C’est légèrement mieux que le zero-shot, où on laisse le LLM se débrouiller seul.

Un exemple serait : « Kootu » est un plat d’accompagnement traditionnel du sud de l’Inde. C’est un plat où vous ajoutez tous les légumes disponibles et le cuisinez jusqu’à obtention d’une consistance proche d’une sauce. On le mange avec du riz ou avec la version crêpe du sud de l’Inde, le Dosa. Un exemple de phrase utilisant le mot « Kootu » est : J’avais cinq légumes dans mon frigo et j’ai décidé de faire un « Kootu » aujourd’hui.

« Shaadi » signifie mariage dans de nombreuses langues indiennes. Donne-moi un exemple de phrase utilisant « Shaadi ». <Sortie> : Mon meilleur ami a célébré sa Shaadi aujourd’hui et nous avons passé un super moment là-bas.

4. Chaîne de raisonnement (CoT)

Une autre méthode est la chaîne de raisonnement (CoT), qui permet un raisonnement complexe en décomposant le problème en étapes.

Par exemple, Raja est allé au marché et a acheté 4 caisses de tomates. Chaque caisse contient 10 tomates. Raja avait déjà 4 tomates dans son frigo. Combien de tomates Raja a-t-il en tout ?

Ici, le LLM pourrait confondre les boîtes et les tomates et répondre 80 (en pensant qu’il y a 4 boîtes dans le frigo). Mais ce n’est pas la bonne réponse. C’est là que l’utilisateur peut demander au LLM de raisonner étape par étape pour obtenir la bonne réponse.

Le LLM répondrait alors : Raja a acheté 4 caisses. Chaque caisse contient 10 tomates. Donc, Raja a ramené 4 x 10 = 40 tomates à la maison. Il avait déjà 4 tomates dans le frigo. Par conséquent, il a maintenant 40 + 4 = 44 tomates.

Ce qui est la bonne réponse.

Distinguer les bons et les mauvais prompts : spécificité et contexte

Souvent, ce qui distingue un bon prompt d’un mauvais, c’est le détail, la spécificité et surtout le contexte.

Pour illustrer la différence, nous avons demandé à ChatGPT lui-même quelques exemples de bons et de mauvais prompts montrant leur influence sur la qualité des réponses générées.

Exemple 1 : Question thématique

Bon prompt : Pouvez-vous donner un aperçu de l’effet de serre et de son impact sur les changements climatiques ?

Mauvais prompt : Parle-moi du temps ?

Selon l’algorithme, la question d’un bon prompt est très spécifique et fournit un contexte clair, ce qui permet à ChatGPT de formuler une réponse bien renseignée. Le mauvais prompt, par contre, manque de spécificité et de direction, ce qui mène à une réponse très générale ou non pertinente.

Exemple 2 : Contextualiser la réponse

Bon prompt : Dans le film « Inception », quel est l’objectif du personnage principal ?

Mauvais prompt : Que se passe-t-il dans « Inception » ?

Ici, le bon prompt donne le contexte de la question en mentionnant le film et pose une question très précise dans ce contexte, ce qui amènera une réponse fidèle. Le mauvais prompt manque de spécificité et suscite une réponse plus générale.

Exemple 3 : Éviter les questions suggestives

Bon prompt : Quels sont les avantages et inconvénients potentiels de l’utilisation des sources d’énergie renouvelables ?

Mauvais prompt : Les sources d’énergie renouvelables sont super, n’est-ce pas ?

Dans cet exemple, le bon prompt pose une question ouverte encourageant une réponse équilibrée qui abordera les points positifs et négatifs des énergies renouvelables pour aboutir à une réponse impartiale. Le mauvais prompt contient une affirmation suggestive, créant un biais – ici, penchant vers le positif des énergies renouvelables, tout en négligeant les aspects négatifs.

Ces exemples sont simples, mais illustrent la différence entre de bons prompts bien conçus, plus spécifiques, contenant des informations contextuelles et ouverts, et de mauvais prompts, qui manquent de spécificité, de contexte et comportent des énoncés suggestifs.

Dans un cas plus complexe, par exemple pour générer du code ou bâtir des applications d’affaires à partir de zéro avec l’IA générative, des prompts bien faits devront être extrêmement détaillés pour produire les bons résultats. Cela nécessitera la présence d’ingénieurs en prompts ayant une connaissance approfondie du projet spécifique.

Alimenter des expériences réinventées pour E.ON

Regarder la vidéo

Regard sur l’avenir de l’ingénierie des prompts

Les organisations commencent seulement à découvrir le potentiel de l’IA générative. Cela signifie que l’ingénierie des prompts est là pour rester. La discipline a un immense potentiel pour des avancées et des applications futures, mais il existe un besoin majeur de poursuivre la recherche, la collaboration et les pratiques éthiques qui façonneront son avenir.

En regardant vers l’avenir, des méthodes automatisées pour générer des prompts efficaces – aujourd’hui élaborés manuellement – pourraient émerger. De plus, pour améliorer la transparence des décisions et instaurer la confiance, les ingénieurs en prompts devront intégrer l’interprétabilité dans leurs prompts, ce qui permettra aux modèles d’IA d’expliquer les résultats générés.

En matière d’atténuation des biais et des enjeux d’équité – sujets majeurs dans la société concernant l’IA –, ceux-ci devraient être pris en compte dès la conception lors de la génération des prompts, tout comme la sécurité est intégrée à la conception de produits, et les ingénieurs devraient incorporer des perspectives diverses dans les prompts.

Enfin, l’importance de l’humain ne saurait être surestimée dans cette évolution de l’IA. Si l’IA générative est une symphonie, alors les ingénieurs en prompts en sont les chefs d’orchestre. L’un ne peut exister sans l’autre. La collaboration humain-algorithme, en plus de la réglementation, sera essentielle pour générer les prompts nécessaires à l’exploration des eaux relativement inconnues d’un futur soutenu par l’IA.

Tags:

IA et GenIA