Mise à l’échelle de l’IA générative grâce à l’infrastructure cognitive et à la gestion financière des opérations (FinOps)

Comment l’infrastructure cognitive soutient les ambitions d’IA générative à grande échelle

Alors que les organisations adoptent de plus en plus l’IA générative pour créer de la valeur commerciale, il devient crucial d’établir une base numérique évolutive, optimisée et flexible

Novembre 14, 2024

3 minutes de lecture

Nicholas Ismail

Global Head of Brand Journalism, HCLTech

Novembre 14, 2024

3 minutes de lecture

Listen à article

30s Backward

0:00 0:00

30s Forward

Lors d'une récente discussion avec HCLTech Trends and Insights, Gaurav Sharma, vice-président adjoint, Gestion des produits Cloud hybride, Unité d’affaires Cloud hybride chez HCLTech, a partagé des perspectives sur le rôle central de l’infrastructure cognitive, de l’automatisation et de la gestion des coûts pour garantir des opérations d’IA efficaces et efficientes.

Bâtir une base avec l’infrastructure cognitive

L’infrastructure cognitive constitue la colonne vertébrale de la GenIA/IA à grande échelle, permettant aux organisations de passer de la preuve de concept (POC) à une production à grande échelle avec agilité et fiabilité. Comme l’a souligné Sharma, « les exigences de l’IA générative et les exigences en matière d’IA… sont devenues la norme. » Cependant, le passage à l’échelle de la GenIA présente des défis particuliers en matière d’infrastructure, allant des grands besoins en ressources de calcul à la connectivité à faible latence et aux importantes exigences de stockage de données qui doivent être abordées sous un angle différent au niveau de la mise en œuvre.

Sharma a souligné que l’optimisation de l’infrastructure est essentielle pour gérer les charges de travail de la GenIA, notamment les grands modèles linguistiques (LLM) et les modèles spécialisés de taille moyenne, surtout en présence d’exigences strictes en matière de sécurité et de conformité. « Vous avez besoin d’un débit élevé d’IOPS [opérations d’entrée/sortie par seconde] », a-t-il noté, en mentionnant l’importance des « exigences de sécurité et de conformité » et parfois même « d’une toute nouvelle architecture… qui exigerait aussi, par exemple, un refroidissement liquide. »

Pour simplifier ce processus, l’infrastructure cognitive propose des « plans types, des architectures... [et] des tailles t-shirt » adaptés à différentes étapes du parcours IA. Cette méthode évite aux entreprises de devoir partir de zéro. Cette approche proactive aide les organisations à sélectionner le bon modèle et l’infrastructure correspondant à leurs besoins et objectifs uniques qui peuvent être déployés facilement et rapidement pour correspondre aux besoins de l’organisation.

L’offre d’Infrastructure Cognitive de HCLTech soutient les organisations dans leur parcours GenIA/IA en mettant en œuvre des stratégies guidées par l’automatisation et l’optimisation des coûts pour différents cas d’usage IA essentiels afin de donner l’échelle voulue à ces ambitions.

Outils d’automatisation et d’optimisation des coûts

L’automatisation et l’optimisation des coûts sont essentielles pour assurer la pérennité des initiatives GenIA à la fois dans les environnements cloud hybrides et publics. L’automatisation doit répondre « à la gestion, la mise à disposition [et] l’exécution des charges de travail GenIA de la manière la plus efficace possible », a expliqué Sharma.

En s’appuyant sur des outils tiers ou des accélérateurs/brevets propriétaires, les organisations peuvent rationaliser leurs opérations et limiter le gaspillage des ressources, une nécessité compte tenu de la complexité des besoins d’infrastructure de l’IA générative.

En plus de l’automatisation, les outils d’optimisation des coûts jouent un rôle crucial. Faire fonctionner la GenIA à grande échelle est exigeant en ressources et peut devenir coûteux si ce n’est pas bien géré.

« Le coût est un facteur majeur », a-t-il précisé, et il influence directement la transition des POC vers des mises en œuvre à grande échelle. Les entreprises doivent peser la « valeur que cela apporte par rapport au coût encouru », en équilibrant à la fois les bénéfices tangibles et intangibles sur l’investissement.

Une façon d’aborder ces coûts est d’adopter les opérations financières (FinOps), que Sharma décrit comme essentielles pour optimiser les dépenses liées à la GenIA. Par exemple, les entreprises qui optent pour des configurations d’IA privées ou hybrides peuvent explorer des modèles d’utilité ou des solutions à la demande pour réduire les coûts initiaux.

Cependant, Sharma a expliqué que « l’optimisation n’est pas la finalité ». L’efficience des coûts doit accompagner chaque phase du parcours IA afin d’éviter toute pression financière sur l’organisation.

Évolution du cloud : le mandat de modernisation

Télécharger le rapport

L’importance des évènements du secteur pour le progrès de l’IA

En regardant vers l’avenir, Sharma a exprimé son enthousiasme à approfondir ces stratégies lors de la Conférence Gartner 2024 EMEA sur l’infrastructure TI, les opérations et les stratégies cloud, où HCLTech sera un sponsor principal. En soulignant l’importance de la conférence, il a déclaré : « c’est un évènement très important pour toute personne s’intéressant à l’infrastructure, aux opérations, aux stratégies… dans l’ère de la GenIA et de l’IA. »

Il a mentionné trois principaux avantages à y participer : écouter les perspectives des experts de Gartner, réseauter avec des pairs pour favoriser l’apprentissage mutuel et explorer les tendances émergentes et le leadership éclairé en IA générative.

La thématique de la conférence, axée sur l’IA, promet de proposer une plateforme pour partager les meilleures pratiques et découvrir des approches innovantes en matière d’infrastructure et d’opérations dans un monde piloté par l’IA.

En conclusion, Sharma a expliqué que ce parcours est fait d’évolution continue, de perfectionnement et d’adaptation, en alignant l’infrastructure et les coûts avec l’objectif ultime d’optimiser la valeur à la fois pour l’organisation et pour ses utilisateurs/finalités.