Nous savons tous ce qu’est l’IA générative (GenAI) et comment elle est devenue une force transformatrice dans notre société en révolutionnant divers aspects de nos vies. Selon les ouvrages, GenAI est une sous-catégorie de l’apprentissage profond, qui est une technique d’apprentissage automatique (ML), et le ML est une branche du vaste ensemble de l’intelligence artificielle (IA) qui permet aux machines d’acquérir des connaissances et d’améliorer leurs performances grâce à l’expérience, sans nécessiter de programmation directe. Si cela vous semble confus, en termes simples, GenAI crée du contenu original en réponse aux requêtes des utilisateurs. Elle peut générer du texte, des images, des vidéos, de la musique ou même du code logiciel sans intervention humaine. Le nombre impressionnant d’applications, allant de la création de chefs-d’œuvre numériques, la composition de symphonies ou la rédaction d’histoires captivantes jusqu’au diagnostic de santé, l’assistance virtuelle, l’amélioration de l’expérience de jeu et la détection précoce de fraude — le tout sans guidance humaine — la distingue de toutes les technologies émergentes apparues au cours des dernières décennies. Et clairement, les chiffres ne mentent pas.

La trajectoire de croissance attendue et la taille du marché de GenAI sont tout simplement remarquables
- Selon McKinsey, les fonctionnalités d’IA générative pourraient ajouter jusqu’à 4,4 billions $ par an à l’économie mondiale et augmenter l’impact de toute l’intelligence artificielle de 15 à 40 %.
- La taille du marché de l’IA générative devrait atteindre 36,06 milliards $ d’ici 2024, avec un taux de croissance annuel impressionnant de 46,47 % de 2024 à 2030.
- Statista estime qu’en 2030, le marché pourrait atteindre un chiffre stupéfiant de 356,10 milliards $.
Quelques cas d’utilisation courants qui alimentent cette croissance de GenAI peuvent être en grande partie catégorisés comme suit :
- Amélioration du service à la clientèle dans des secteurs comme le commerce de détail, le voyage, l’hôtellerie et le commerce électronique.
- Mise en œuvre de solutions d’assistant virtuel, telles que l’assistance aux patients, le conseil financier, le bureau de service intelligent/soutien à distance, etc.
- Autonomisation des employés pour rationaliser et automatiser des tâches comme la gestion de projet, la création de code, l’analyse de données pour les décisions d’affaires et les recommandations de procédures écrites (SOP - Procédures opérationnelles standards).
- Production de contenu et d’actifs innovants comme la musique, l’art et les textes. Création de matériel marketing dans le secteur du commerce électronique, création d’actifs visuels, campagnes marketing, etc.
- Capacités prédictives comme la détection de fraude, la maintenance prédictive, le diagnostic médical, la conformité d’audit, etc.
- Optimisation des flux de travail ou des processus à l’aide de simulations et d’apprentissage adaptatif, comme le conseil financier, la modélisation de construction, les simulations de processus manufacturier, le réglage des performances du réseau, la planification de trajets, la découverte de médicaments, etc.
GenAI et l’infrastructure TI
GenAI peut non seulement exécuter vos tâches routinières, mais aussi vous aider dans la réflexion créative et l’idéation. Voyons cela dans le contexte de l’infrastructure TI.
- Elle peut créer des stratégies d’optimisation pour les opérations du cloud ou du centre de données pendant que l’IA optimise dynamiquement l’allocation des ressources en fonction de la demande en temps réel et des tendances historiques. Elle alloue les ressources aux charges de travail critiques et gère efficacement les tâches non essentielles ; la performance est optimisée et les coûts sont réduits. Cette agilité assure une efficacité globale supérieure.
- GenAI peut être déployée pour simuler différents scénarios en jouant avec l’espace, l’alimentation et les besoins de refroidissement dans un centre de données. Cela peut aider à optimiser la densité TI et ajouter une charge TI supplémentaire tout en améliorant la durabilité du centre de données.
- GenAI peut aider à améliorer la cybersécurité en créant des cas de test. Grâce à l’analyse prédictive, elle peut détecter les vulnérabilités, faire de la détection de hameçonnage, effectuer des plannings automatisés de correctifs de sécurité, améliorer la biométrie et créer des simulations de menaces.
- GenAI peut également contribuer à améliorer la mise en réseau en rédigeant des programmes et des scripts, en créant de la documentation, en formalisant des politiques et configurations, en assistant lors des audits, en répondant aux incidents, en agissant comme un assistant virtuel ou mentor pour les professionnels du réseau. Les autres cas d’utilisation incluent la billetterie automatisée dans les centres de données, le dépannage informatique, les chatbots de soutien personnalisé et le soutien à distance.
Cela semble très prometteur, mais la réalité, dans le contexte de l’infrastructure TI, est plutôt contrastée. Tant dans le domaine de l’infrastructure TI qu’ailleurs, beaucoup de puissance de calcul est nécessaire pour répondre à la demande de tous ces cas d’utilisation.
L’impact de l’IA générative sur l’infrastructure TI
Considérons les trois sources d’infrastructure TI pouvant faire fonctionner les charges de travail GenAI, soit les fournisseurs de cloud, les fournisseurs de colocation et les centres de données d’entreprise, pour comprendre l’impact de l’augmentation de la demande en GenAI ou en infrastructure TI à un niveau beaucoup plus fin. À mesure que les modèles d’IA générative accessibles au public comme Midjourney et ChatGPT gagnent en popularité, l’intérêt pour leur potentiel économique se traduit par un tsunami de demande en IA. Cette poussée de la demande provoque une frénésie de location de centres de données, avec environ 2,1 GW de contrats de location de centres de données signés aux États-Unis entre la mi-mai et la fin juillet. Les fournisseurs de nuage ou hyperscalers se tournent vers les opérateurs de colocation pour répondre à leurs besoins de capacité. Il faut reconnaître que les architectures de centres de données pour l’IA sont encore relativement inexplorées et que des améliorations viendront pour les optimiser, mais même en tenant compte de cela, environ 7 % de la production mondiale d’électricité sera consommée par l’infrastructure des centres de données et des communications d’ici 2030. Cela soulève non seulement des questions sur l’utilisation discutable des ressources TI, mais aussi sur celle de GenAI elle-même. Ceux qui travaillent dans le domaine GenAI doivent également considérer l’impact de cette technologie sur notre environnement et comprendre si les avantages de GenAI l’emportent réellement sur les coûts.
Comme nous le savons tous, en raison du caractère novateur de GenAI, il existe une barrière matérielle et les fabricants de GPU (unités de traitement graphique) font face à des goulots d’étranglement en raison de l’offre limitée de puces. Cela crée une situation monopolistique où les fabricants de GPU sont les faiseurs de roi et les hyperscalers les rois. La voie du cloud semble intéressante, compte tenu des faibles coûts initiaux. Mais à mesure qu’on approfondit la discussion cloud contre locaux, il ressort que l’alternative la plus rentable dépendra de votre avancée dans votre parcours infonuagique. Vos données sont-elles sur site ou déjà dans le cloud ? À quel point développerez-vous vos capacités d’IA ? Et quel est l’objectif final que vous cherchez à atteindre ? Il faut comprendre que le TCO global (coût total de possession), soit le coût d’exploitation des charges de travail GenAI sur site, pourrait être inférieur à celui dans le cloud, à condition que vous ayez déjà testé le cloud et défini vos besoins spécifiques en matière de matériel et de stratégie IA.
Deuxièmement, outre le coût matériel, l’avènement de l’IA privée où des données privées, des renseignements sensibles (comme des informations sur les employés ou les finances d’entreprise) servent d’ensembles de données pour entraîner le modèle d’IA, en plus d’autres grands modèles publics (LLM — Large Language Models), fait aussi renaître la discussion sur les centres de données d’entreprise.
La prochaine demande unique pour les applications GenAI concerne l’alimentation, l’espace et le refroidissement. Pour accueillir du matériel supplémentaire dans l’installation actuelle, il s’agit essentiellement d’augmenter la densité TI dans un centre de données : une tâche de taille. Certains diront que les installations de centres de données de pointe actuelles sont déjà à un niveau d’optimisation tel qu’il reste peu, voire plus du tout, de marge de progression. Nous devrons donc peut-être nous tourner vers ce qui a tout déclenché : GenAI. Peut-on utiliser GenAI pour optimiser encore plus le centre de données ? La réponse est un grand oui.
En conclusion, la relation entre GenAI et son infrastructure sous-jacente de soutien est plutôt ambivalente. L’IA générative recèle certainement un potentiel immense de par la vaste gamme de ses applications. Mais nous devons aussi l’utiliser de façon responsable, compte tenu de l’effet qu’elle a sur l’infrastructure sous-jacente et l’environnement. La meilleure façon d’y parvenir consiste à déployer GenAI, ou l’IA en général, pour optimiser l’infrastructure et tirer le meilleur parti de nos ressources. Les entreprises doivent se préparer à comprendre tous les aspects possibles de leur plan et stratégie pour l’adoption de GenAI et adopter une approche plus holistique. Les approches doivent être souples et expérimentales, puisque c’est une nouvelle technologie en évolution constante, afin d’obtenir les meilleurs résultats possibles.
Pour en savoir plus, veuillez nous écrire à HCBU-PMG@hcltech.com.
Réf. :
- https://www.mckinsey.com/industries/technology-media-and-telecommunications/our-insights/beyond-the-hype-capturing-the-potential-of-ai-and-gen-ai-in-tmt
- https://www.prnewswire.com/news-releases/generative-ai-market-to-be-worth-109-37-billion-by-2030-grand-view-research-inc-301718827.html#:~:text=SAN%20FRANCISCO%2C%20Jan.,34.6%25%20from%202022%20to%202030
- https://www.turing.com/resources/generative-ai-enhances-cybersecurity
- https://tmotions.com/applications-of-generative-ai-in-it-infrastructure-optimization/
- https://www.datacenterknowledge.com/industry-perspectives/rise-generative-ai-and-its-impact-data-center-sector
- https://pisrt.org/psr-press/journals/easl-vol-3-issue-2-2020/new-perspectives-on-internet-electricity-use-in-2030/
- https://www.forbes.com/sites/tiriasresearch/2023/05/12/generative-ai-breaks-the-data-center-data-center-infrastructure-and-operating-costs-projected-to-increase-to-over-76-billion-by-2028/?sh=522fb7d17c15
- https://medium.com/@kyeg/cloud-vs-on-premise-where-to-deploy-your-ai-applications-b584335ae86a
- https://medium.com/venture-beyond/on-ai-the-gpu-shortage-and-the-potential-of-decentralised-inference-and-training-networks-2442527af18e
- https://www.techtarget.com/searchnetworking/tip/The-role-of-generative-AI-in-networking#:~:text=How%20GenAI%20can%20support%20networking,workloads%2C%20even%20as%20staffing%20declines.
