Transformer le calcul haute performance pour un fabricant de premier plan avec AWS

Optimiser le calcul haute performance (HPC) avec AWS pour l’automatisation, l’évolutivité, les économies de coûts et l’innovation
4 min de lecture
Partager

Un leader mondial de la fabrication de pneus ayant son siège social à Tokyo s'est associé à HCLTech pour transformer son environnement en utilisant AWS. L'initiative a résolu des inefficacités critiques en mettant en œuvre un déploiement automatisé de l'infrastructure, une mise à l'échelle dynamique et un suivi des coûts des ressources, y compris les processus manuels, une évolutivité limitée et des frais de licence élevés. Cette modernisation a amélioré l'évolutivité, réduit les coûts opérationnels et renforcé la visibilité des ressources, permettant une innovation plus rapide et des performances optimisées grâce à un paysage HPC flexible et natif du cloud.

Le défi

Notre client faisait face à une augmentation des inefficacités et des complexités au sein de son environnement HPC, principalement en raison d'un manque d'automatisation et d'évolutivité. Les principaux défis comprenaient :

  • Absence d'automatisation à la demande : La plateforme HPC ne disposait pas de capacités d'automatisation, ce qui entraînait des processus manuels chronophages
  • Ressources de cluster inflexibles : L'environnement HPC ne pouvait pas évoluer dynamiquement pour répondre à la demande fluctuante, créant ainsi des goulets d'étranglement
  • Coûts de licences élevés : Le client était accablé par les frais de licence du logiciel IBM LSF et ne pouvait pas passer à une solution plus rentable
  • Manque de transparence sur les coûts : Il n’y avait aucun mécanisme pour suivre la consommation des ressources par utilisateur ou unité d'affaires (BU), ce qui empêchait une répartition précise des coûts et la refacturation interne
  • Évolutivité limitée : L'incapacité à étendre les ressources HPC a limité la capacité du client à répondre à la croissance des besoins en données et en calcul
Les défis

L’objectif

L’objectif était de créer un environnement HPC efficace et évolutif qui réduisait les coûts opérationnels et la complexité tout en permettant le suivi des ressources pour la gestion des coûts internes.

  • Automatiser le déploiement de l’infrastructure : Utiliser l’infrastructure sous forme de code (IaC) pour créer des ressources HPC à la demande, assurant évolutivité et efficacité
  • Optimiser le coût total de possession (TCO) : Mettre en œuvre un modèle commercial flexible et éliminer les coûts de licences associés à IBM LSF
  • Permettre des mécanismes de refacturation : Développer une comptabilité des ressources pour suivre les coûts par utilisateur et faciliter la refacturation au niveau de l’unité d’affaires
  • Améliorer l’élasticité : Mettre en place un cluster HPC plus flexible et réactif pour prendre en charge la mise à l’échelle à la demande avec des instances Amazon EC2
L’objectif
Transformer l’informatique haute performance pour un fabricant de premier plan avec AWS

La solution

Pour atteindre ces objectifs, ont livré une solution HPC complète axée sur l'automatisation, l'efficacité des coûts et l'évolutivité. La solution comprenait :

Évaluation

  • Réalisation d'une évaluation approfondie de l'environnement HPC du client afin d'identifier précisément les goulets d'étranglement et les inefficacités
  • Identification des exigences et contraintes en ressources propres à l'entreprise et au secteur du client

Construction

  • Approvisionnement automatisé : Des pipelines Terraform ont été utilisés pour automatiser le déploiement des ressources HPC, y compris les instances AWS HPC7a et HPC6i
  • Visualisation améliorée : Utilisation de NICE DCV pour configurer la visualisation à distance sur demande, permettant aux utilisateurs de gérer les tâches de pré et post-traitement à distance
  • Gestion de tâches simplifiée : Configuration de Slurm pour la planification et la gestion des tâches, avec intégration de l'API REST afin d'automatiser les soumissions de tâches en fonction des profils utilisateurs
  • Suivi des coûts et refacturation : Mise en place d'une comptabilité des ressources pour suivre précisément l'utilisation des ressources par utilisateur, permettant des refacturations exactes aux diverses unités d'affaires

Exploitation

  • Gestion opérationnelle de bout en bout, garantissant une gestion fluide et efficace des tâches HPC quotidiennes
  • Mise en place d'une surveillance continue de l'environnement HPC pour assurer des performances optimisées et une efficience des coûts
Solution

L'impact

Grâce au nouveau paysage HPC, le client a bénéficié d'un environnement flexible et automatisé qui a considérablement amélioré l'évolutivité, réduit les coûts et optimisé l'utilisation des ressources.

  • Économies de coûts : Le client a réalisé des économies substantielles en éliminant les licences IBM LSF et Bright Cluster Manager et en adoptant AWS ParallelCluster, qui offre des fonctionnalités similaires dans un format natif sur le cloud et rentable
  • Délai d'innovation réduit : Les performances des tâches ont augmenté de 30 à 40 %, permettant au client de réaliser des simulations plus rapidement et de réduire le temps nécessaire pour obtenir des informations
  • Visibilité accrue des ressources : Le suivi des coûts mis en place a offert une visibilité claire sur l'utilisation des ressources par utilisateur, ce qui permet une facturation interne précise et un contrôle des coûts
  • Évolutivité et élasticité : L'environnement HPC basé sur AWS s'adapte dynamiquement à la demande, assurant au client de répondre aux charges de pointe sans payer pour des ressources inactives

Services AWS utilisés :

  • Amazon EC2
  • AWS ParallelCluster
  • AWS Batch
  • Amazon Elastic File System (EFS)
L'impact
ERS Ingénierie numérique Étude de cas Transformer le calcul haute performance pour un fabricant de premier plan avec AWS