Transforming the "digital attic" into an intelligent asset engine with HCLTech Media-IQ

6 min de lecture
Partager

HCLTech a mis en œuvre Media-IQ pour migrer une bibliothèque de bandes multi-pétaoctets, un centre de données physique, pour un géant mondial du divertissement. En tirant parti d'une stratégie d’ingestion « touch-and-go » et d’une recherche sémantique propulsée par l’IA générative, nous avons réduit les délais de récupération allant jusqu’à 90 % et permis la monétisation instantanée des propriétés intellectuelles historiques.

Le client est un important conglomérat mondial de , responsable de certaines des franchises de films et séries télévisées les plus emblématiques au monde. Ils exploitent un écosystème de contenu multiplateforme couvrant les sorties en salles, les réseaux linéaires et un service de diffusion en continu direct au consommateur en forte croissance.

Le défi

Le client possédait une archive de plus de 20 Po d’actifs vidéo de grande valeur, confinée dans des librairies de bandes physiques, des silos nécessitant une maintenance manuelle et des systèmes NAS hérités. Alors que l’entreprise évoluait vers un modèle axé d’abord sur la diffusion en continu, ces architectures patrimoniales sont devenues un goulet d’étranglement. Les priorités stratégiques comprenaient :

Le défi
  • Démocratiser l’accès : Éliminer la dépendance envers le « gardien » des opérations sur bandes physiques pour accéder à la propriété intellectuelle historique
  • Vitesse de monétisation : Réduire le temps nécessaire pour restaurer, remastériser et redistribuer le contenu du catalogue de fonds pour les plateformes de diffusion en continu
  • Contrôle des coûts : Échapper au cycle récurrent de renouvellement de matériel désuet coûtant plusieurs millions de dollars (dépenses en immobilisations) et aux coûts de maintenance imprévisibles
  • Préparation à l’IA : Structurer les métadonnées pour permettre à l’avenir la recherche de contenu et la personnalisation par l’IA

L’objectif

L’objectif principal était de passer d’un modèle sur bande « stocker et oublier » à une chaîne d’approvisionnement de médias active. Les objectifs supplémentaires du projet comprenaient :

L’objectif
  • Conserver plus, payer moins : Réduire le coût total de possession (TCO) tout en assurant une durabilité des données à 100 % et la conformité
  • Liquidité des actifs : Permettre la découverte en moins d’une seconde de scènes et concepts précis
  • Préparation prédictive : Prévoir la demande pour « préchauffer » les actifs avant le lancement des campagnes
L’objectif

La solution

L’approche a été exécutée dans le cadre d’une modernisation par étapes afin d’assurer la continuité des activités tout en effectuant la migration à grande échelle.

La solution

Phase 1 : Découverte et plan directeur d’architecture

Collecte des exigences

  • Consultation initiale : Animé des séances exploratoires avec les opérations du studio, les équipes de postproduction et juridiques afin de cartographier les modes d’accès (contenu chaud vs. froid) et de définir les engagements de conservation (SLAs)
  • Évaluation des risques : Identification des risques critiques liés à la "dégradation de données" des bandes héritées et la nécessité d’un suivi strict de la chaîne de garde pour le contenu avant la sortie

Ateliers et planification stratégique

  • Cartographie de la gouvernance : Définition d’un schéma "Politique-avant-Données" pour automatiser la gestion des droits et de la conservation
  • Architecture du coffre : Mise en place d’une logique de "coffre principal" séparant clairement les actifs de préservation des copies de distribution (OTT) pour établir des SLAs réalistes et maximiser la durabilité
  • Conception de la solution : Création d’un plan de migration robuste tirant profit d’AWS DataSync pour des transferts avec vérification par sommes de contrôle, et d’AWS Direct Connect pour protéger la bande passante de production
  • Dissociation propriétaire : Élaboration d’une feuille de route pour éliminer la dépendance à l’intergiciel de gestion de bandes propriétaire (MWM), en passant à un stockage objet à normes ouvertes

Phase 2 : Migration intelligente et modernisation

Succès de la migration
Ingestion automatisée et sécurisée :

  • Transfert haute vélocité : Utilisation d’AWS DataSync pour paralléliser les transferts depuis le NAS local, avec vérification des sommes de contrôle en temps réel afin d’assurer l’intégrité parfaite des fichiers maîtres
  • Intégration Snowball Edge : Pour les archives froides les plus profondes, l’ingestion massive a été accélérée à l’aide de dispositifs hors ligne afin de court-circuiter les limitations réseau
  • Intelligence de contenu GenAI : Invocation d’Amazon Bedrock Data Automation pour extraire les métadonnées descriptives (célébrité, scène, sentiment) alors qu’AWS Lambda saisit les caractéristiques techniques (codec, débit binaire). Ceci crée un "index multimodal" dans OpenSearch
  • Génération de proxy mezzanine : Lors de l’ingestion, le flux de travail déclenche AWS Elemental MediaConvert afin de créer des proxys H.264 légers. Ceux-ci résident en permanence dans S3 Standard, permettant un aperçu et une vérification instantanés à l’échelle mondiale, sans supporter les coûts ou délais de restauration du maître haute résolution depuis le coffre

Orchestration et gestion intelligente des niveaux :

  • Logique du cycle de vie : Mise en œuvre de Step Functions pour orchestrer une stratégie "Touch-and-Go". Les actifs arrivent dans Amazon S3 Standard pour un traitement IA immédiat et une génération de proxy, ce qui permet d’éviter les frais minimaux de 30 jours des niveaux IA. Une fois traités, les fichiers maîtres sont transférés sur place vers Amazon S3 Glacier Deep Archive (coffre principal)
  • Garde-fous de coûts : Développement d’une logique personnalisée pour prédire les coûts de récupération avant exécution, évitant ainsi un "choc de restauration" accidentel des niveaux d’archives profonds

Sécurité et conformité :

  • Immutabilité : Déploiement de S3 Object Lock en mode conformité pour appliquer les mandats de conservation (7 à 10 ans), rendant les actifs immuables face aux rançongiciels ou à la suppression accidentelle
  • Accès granulaire : Implémentation d’AWS IAM et de politiques de compartiment pour garantir que seules les équipes créatives autorisées peuvent accéder au contenu de pré-lancement à forte valeur ajoutée
  • Prêt pour l’audit : Remplacement des journaux manuels sur bande par AWS CloudTrail, offrant un historique consultable et immuable de chaque demande d’accès pour les auditeurs internes et externes

Couche de recherche et d’analytique :

  • Catalogue unifié : Indexation de toutes les métadonnées techniques et descriptives dans Amazon OpenSearch Service, permettant aux monteurs de rechercher du contenu par réalisateur, année, résolution ou statut des droits en quelques millisecondes
  • Perspectives d’affaires : Déploiement de tableaux de bord Amazon QuickSight pour visualiser la consommation de stockage et identifier les "données zombies" pouvant être déplacées vers un entrepôt plus froid afin d’économiser

Rappels prédictifs :

  • Prédiction gouvernée : Ingestion de signaux d’affaires externes (calendriers marketing, données de gestion des droits) via Amazon AppFlow. Ces signaux sont régis par Athena et injectés dans SageMaker pour prévoir la demande
  • Prévision de la demande : Cet ensemble de données gouverné alimente Amazon SageMaker pour prédire quels actifs seront requis lors des prochains anniversaires de franchises, déclenchant une "préparation" automatique à partir du coffre

Analyse financière

Le passage d’une bibliothèque de bandes physiques à un modèle natif infonuagique a fondamentalement changé le profil financier du client : d’un centre de coûts à forte intensité de capital à une dépense d’exploitation prévisible.

Les "coûts cachés" des bandes héritées

Notre analyse de la trajectoire locale du client a révélé d’importantes frictions financières :

  • Pics d’investissements imprévisibles : Le modèle hérité exigeait des investissements initiaux massifs pour les cadres et lecteurs de bibliothèque, puis des cycles de "rafraîchissement" perturbateurs (ex. : migration des données vers de nouvelles générations de bandes tous les 5 à 7 ans)
  • Fardeau élevé de la maintenance : Les contrats de soutien annuels et les frais d’entreposage externe ajoutaient ~500k $/an en coûts de "maintien des opérations", peu importe la quantité de données effectivement récupérée

L’avantage OpEx

En migrant vers la solution basée sur AWS de HCLTech, le client a obtenu un profil de flux de trésorerie "régulier" :

  • Dépenses linéaires : Les coûts AWS se sont stabilisés et corrélés directement avec le volume de stockage et l’activité de récupération
  • Efficacité à l’utilisation : L’architecture à paliers garantit que le principal dépôt maître réside dans Glacier Deep Archive (le moins coûteux), tandis que seuls les proxys légers et les restaurations temporaires résident dans S3 Standard. Nous avons éliminé les pénalités de "durée minimale de 30 jours" associées aux niveaux Accès peu fréquent, assurant que le client ne paie que pour le temps de calcul exact utilisé lors de l’ingestion
  • Prévisibilité budgétaire : Nous avons remplacé le "choc fiscal" des événements de fin de vie du matériel par un modèle opérationnel mensuel prévisible, simplifiant la planification à long terme pour le service des finances

« Les bandes héritées représentent des CapEx dont on ne se débarrasse jamais. L’archive AWS est un OpEx que l’on peut planifier — et non subir. »

L'impact

Nous avons transformé l’archive du client, qui était un passif, en un atout dynamique, permettant d’accélérer la mise en marché de leur contenu et de réaliser des économies opérationnelles significatives.

L'impact

Mise en marché accélérée :

  • Jusqu’à 90 % de restauration plus rapide : Temps de récupération des éléments réduit de plusieurs jours (transport de bandes physiques) à quelques minutes/heures, ce qui permet de répondre rapidement aux tendances de diffusion en continu et aux occasions promotionnelles
  • Gains de productivité : Réduction de 50 à 70 % des courriels manuels « aller-retour » entre les équipes créatives et de stockage grâce aux API libre-service

Efficacité financière :

  • Cycles de CapEx éliminés : Suppression du besoin de renouvellement coûteux de la bibliothèque de bandes et de contrats de maintenance, passage à un modèle prévisible de dépenses opérationnelles à l’utilisation
  • Optimisation des coûts : Réduction de 50 à 70 % des coûts de stockage en utilisant la hiérarchisation intelligente pour conserver la majeure partie de la bibliothèque de 20 PB dans les niveaux Glacier Deep Archive les moins coûteux

Résilience opérationnelle et innovation :

  • Gouvernance rapide : Temps de préparation des audits réduit de plusieurs semaines à quelques heures, économisant environ 28 journées-personnes par année lors des vérifications de conformité
  • Augmentation de la « retrouvabilité » : Amélioration du taux de conversion entre la recherche et l’utilisation, garantissant que la PI de valeur n’est pas perdue dans le « grenier numérique » et qu’elle peut être facilement réutilisée pour de nouveaux revenus
  • Fondation prête pour l’IA : L’archive est maintenant un lac de données structuré, prêt pour les flux de travail d’IA générative tels que la création automatisée de bandes-annonces, l’étiquetage à recherche approfondie et la localisation de contenu

Services AWS utilisés

  • Ingestion : AWS DataSync, AWS Direct Connect, AWS Snowball Edge, Amazon AppFlow
  • Orchestration et calcul : AWS Step Functions, AWS Lambda, Amazon EventBridge
  • Stockage : Amazon S3 (Standard et Glacier Deep Archive)
  • Média et IA : AWS Elemental MediaConvert, Amazon Bedrock Data Automation, Amazon SageMaker
  • Analytique et gouvernance : Amazon Athena, AWS Glue, Amazon OpenSearch Service, Amazon QuickSight, AWS CloudTrail
Nuage et écosystème AWS Étude de cas Transforming the "digital attic" into an intelligent asset engine with HCLTech Media-IQ