Transformer l’informatique haute performance pour une société pharmaceutique suisse

5 min de lecture
Partager

Le confrontée à d’importants défis dans la gestion d’un environnement informatique haute performance (HPC) complexe. Avec plus de 50 nœuds, dont plus de 10 nœuds GPU, le client rencontrait des difficultés liées à l’extensibilité, à des inefficacités opérationnelles et à un manque de visibilité sur l’infrastructure. Ces problèmes entraînaient des temps d’arrêt fréquents et des performances restreintes, nuisant à leur capacité à répondre rapidement aux exigences de l’entreprise. La solution a consisté à migrer vers un environnement HPC AWS automatisé, alimenté par des instances EC2 avec processeur AMD EPYC™ et l’expertise de modernisation infonuagique de HCLTech, ce qui a rationalisé les opérations, amélioré l’extensibilité et réduit les interruptions, permettant ainsi à l’entreprise d’innover plus rapidement et d’améliorer sa performance globale.

Le défi

Notre client est une société pharmaceutique multinationale suisse. Le client dispose d’un paysage HPC de plus de 50 nœuds avec plus de 10 nœuds GPU et fait face à des défis en matière d’exploitation et de gestion du cluster. Un manque d’évolutivité entraîne des performances restreintes et une visibilité limitée de l’infrastructure.

Défi
  • Paysage HPC complexe et manque d’opérations rationalisées : Le client rencontrait des difficultés à effectuer l’administration quotidienne du cluster et à accomplir diverses opérations liées au HPC, ce qui entraînait des temps d’arrêt.
  • Manque d’infrastructure élastique et évolutive : Ce défi a entraîné un manque de mise à disposition plus rapide (infrastructure et services) en réponse aux besoins de l’entreprise, ce qui a créé des goulets d’étranglement et limité les performances.
  • Manque de flexibilité et de visibilité : L’absence de modèles de consommation flexibles à la demande et la visibilité limitée de l’infrastructure nuisaient à la transparence.
  • Absence d’automatisation sur demande : La plateforme HPC manquait de capacités d’automatisation, ce qui a entraîné des processus manuels chronophages.

L’objectif

L’objectif était d’assurer un environnement HPC fiable et évolutif pour le client, ce qui a permis d’améliorer les performances globales et d’assurer la gestion de bout en bout du paysage tout en accroissant la visibilité du paysage et en augmentant le temps de disponibilité.

Objectif
  • Automatiser le déploiement de l’infrastructure : Utiliser l’Infrastructure as Code (IaC) pour créer des ressources HPC à la demande, garantissant évolutivité et efficacité.
  • Accroître l’élasticité : Mettre en place un cluster HPC plus flexible et réactif pour permettre un passage à l’échelle à la demande avec les instances Amazon EC2.

La solution

La solution repose sur une performance accrue et des capacités d'automatisation intégrées afin d’offrir une expérience fluide et une migration des données de l’environnement local vers AWS. L’élasticité offerte par AWS a permis d’atteindre l’évolutivité requise et d’optimiser le TCO. HCLTech a conçu une feuille de route de modernisation en plusieurs phases, combinant l’automatisation native AWS à des instances Amazon EC2 alimentées par les processeurs AMD EPYC™. Cette approche a permis d’améliorer le rendement des charges de travail, de réduire les coûts liés au cloud et de renforcer l’agilité opérationnelle pour les tâches à forte intensité de calcul.

Solution

Évaluation

  • Réalisation d'une évaluation approfondie du paysage HPC actuel et identification des goulets d'étranglement spécifiques.
  • Identification des besoins spécifiques et des contraintes de l’environnement HPC du client.
  • Évaluation des profils de charges de travail pour prioriser les cas d’utilisation non intensifs en processeurs et optimisés pour le calcul, idéaux pour des instances EC2 basées sur AMD.

Construction

  • Approvisionnement automatisé – Utilisation de pipelines Terraform pour automatiser le déploiement des ressources HPC, via Terraform.
  • Mise à l’échelle automatique – Mise en place d’une infrastructure élastique capable de répondre à des besoins importants en ressources et configuration de la mise à l’échelle automatique des nœuds HPC selon la simulation EDA.
  • Gestion simplifiée des tâches – Configuration de la planification et de la gestion des tâches, avec intégration de l’API REST pour automatiser la soumission des tâches selon les profils utilisateurs.
  • Logiciel de surveillance – Mise en œuvre d’un logiciel qui surveille le cluster HPC et alerte vos administrateurs en cas de problème avant que cela n’impacte les utilisateurs.
  • Intégration d’instances EC2 basées sur AMD EPYC™ dans le paysage HPC pour une densité de calcul supérieure et un tarif optimisé par cœur, garantissant un rendement maximal avec un coût d’inactivité minimal.

Exploitation

  • Gestion des opérations de bout en bout, assurant une gestion efficace et sans heurt des tâches HPC quotidiennes.
  • Mise en place d’une surveillance continue de l’environnement HPC afin d’assurer une performance et une efficacité optimale des coûts.
  • Introduction d’une surveillance logicielle pour surveiller toutes les ressources afin d’identifier et répondre plus rapidement aux anomalies.
  • Implémentation d’un réglage continu des performances à l’aide de nœuds propulsés par AMD afin d’équilibrer performance et efficacité budgétaire.

L'impact

La a aidé le client à atteindre ses objectifs de transformation HPC et à obtenir une mise en valeur et une innovation plus rapides.

Impact
  • Opérations rationalisées — HCLTech a géré le support complet de la plateforme HPC, a effectué l’optimisation et a amélioré les opérations HPC en introduisant l’automatisation et un point de gestion unique avec Bright Cluster Manager.
  • Réduction des temps d'arrêt – La transformation et la gestion du paysage HPC par HCLTech ont considérablement réduit les temps d’arrêt et amélioré la mise en valeur.
  • Évolutivité et élasticité – L’environnement HPC basé sur AWS évolue désormais dynamiquement selon la demande, garantissant que le client puisse répondre aux pics de charge sans payer pour des ressources inutilisées. Aucun temps d’attente pour l’exécution des simulations
  • Efficacité des coûts - A permis des économies de coûts substantielles en migrant les charges de travail appropriées vers des instances EC2 alimentées par AMD EPYC™, améliorant à la fois l’efficacité de la performance et le rendement global du capital investi.
  • La migration a permis l’utilisation des instances EC2 de dernière génération, améliorant le support de fin de vie.

Services AWS et produit AMD

  • Amazon EC2 avec auto-scaling
  • Amazon Elastic File System (EFS)
  • Amazon FSx pour NetApp
  • AWS Elastic Load Balancer (ELB)
  • Instances Amazon EC2 alimentées par AMD EPYC™
Nuage et écosystème Nuage Étude de cas Transformer l’informatique haute performance pour une société pharmaceutique suisse