HCLTech Media-IQ: Turning the "digital attic" into an AI content engine on AWS

Découvrez comment HCLTech Media-IQ sur AWS transforme les archives sur bande en moteurs de contenu alimentés par l’IA, réduisant les temps de restauration jusqu’à 90 % et ouvrant la voie à de nouveaux revenus.
10 min de lecture
Puvaneswaran Arumugam

Author

Puvaneswaran Arumugam
Architecte de solutions AWS, écosystème AWS chez HCLTech
10 min de lecture
AWS

Résumé Exécutif

Les entreprises médiatiques conservent des archives de plus de 20 pétaoctets, souvent stockées sur des bandes physiques qui demeurent généralement inaccessibles. Cela crée des défis importants : occasions de revenus en licences perdues, inefficacités opérationnelles et délais prolongés pour la récupération de contenu. HCLTech Media-IQ, bâti sur AWS, transforme ces « greniers numériques » en plateformes de contenu intelligentes alimentées par l’IA. En tirant parti d’Amazon Bedrock pour la compréhension du contenu et d’Amazon SageMaker pour l’analytique prédictive, la solution réduit les délais de restauration jusqu’à 90 % et convertit le stockage passif en sources de revenus actives.

Introduction

La demande mondiale en contenu n’a jamais été aussi élevée. Pour alimenter les plateformes de diffusion en continu 24/7 et les canaux de médias sociaux, les studios s’empressent de produire de nouvelles émissions. Cependant, les actifs les plus précieux existent souvent déjà. Des décennies de films, de productions télévisuelles et d’archives sportives restent bloquées dans des bibliothèques de bandes LTO, qu’il est difficile de rechercher, long à récupérer et coûteux à entretenir.

HCLTech collabore avec afin de résoudre cette « paralysie du contenu ». En passant d’un système rigide à bandes vers l’infonuagique, les studios peuvent passer d’une posture défensive (garder les données en sécurité) à une posture offensive (utiliser les données pour monétiser). Ce changement transforme l’archive d’un centre de coûts en usine de contenu. Le transfert de pétaoctets de copies maîtresses de films vers l’infonuagique n’est plus simplement une question de « sacs bon marché ». Il s’agit de la liquidité des actifs.

Le Besoin

Le fait face à une « crise silencieuse » d’accessibilité. Les archives traditionnelles reposent sur des robots à bandes physiques et du stockage hors ligne, générant trois points de douleur distincts :

  1. Le « trou noir » des métadonnées : Les bandes sont souvent mal étiquetées. Les monteurs savent qu’une prise existe « quelque part dans les archives de 1998 », mais la trouver exige une récupération physique et un examen manuel, ce qui prend souvent des jours
  2. Latence de récupération : Dans un cycle de nouvelles ou de sports, la rapidité est essentielle. Attendre 24 à 48 heures pour qu’une bande soit chargée et transférée par robotique est trop lent pour les flux de production modernes
  3. Imprévisibilité des coûts : Les systèmes hérités subissent des « chocs CapEx » – de gros investissements requis tous les quelques années pour remplacer des lecteurs et des bibliothèques vieillissants, peu importe la performance de l’entreprise

Architecture de solution

HCLTech Media-IQ transforme les archives traditionnelles en médiatiques automatisées. La solution combine la durabilité d’Amazon S3 avec les services d’IA générative d’AWS pour séparer la découverte (toujours accessible à la recherche) de la préservation (stockage optimisé pour les coûts).

Media-IQ sert d’orchestrateur intelligent de chaîne d’approvisionnement. Notre avantage distinctif est défini par trois piliers financiers et opérationnels clés :

  • Optimisation financière (« touch-and-go ») : Le contenu est stocké dans Amazon S3 Standard pour le traitement immédiat par l’IA, puis transféré vers Amazon S3 Glacier Deep Archive. Cette approche évite les pénalités de durée minimale de stockage tout en maintenant l’efficacité du traitement
  • Dissociation de la découverte et de la récupération : Lors de l’ingestion, Media-IQ crée des fichiers proxy légers dans le stockage à chaud tout en archivant les fichiers maîtres. Les éditeurs peuvent rechercher et prévisualiser instantanément l’ensemble de la bibliothèque sans frais de récupération ni temps d’attente
  • Gouvernance automatisée : AWS Step Functions orchestre les politiques du cycle de vie, tandis qu’Amazon S3 Object Lock assure une conservation immuable qui empêche toute suppression accidentelle ou tout déplacement non autorisé de données

La couche d’intelligence IA

La différenciation de Media-IQ provient de son extraction de valeur alimentée par l’IA, basée sur Amazon Bedrock et Amazon SageMaker :

  • Intelligence multimodale des ressources avec Amazon Bedrock : L’automatisation des données Amazon Bedrock analyse le contenu vidéo pour en extraire un contexte riche – en identifiant les personnes, les objets, les caractéristiques de scène (p. ex. « poursuite en voiture tendue ») et les spécifications techniques. Cela transforme les noms de fichiers génériques en ressources d’affaires interrogeables avec des métadonnées détaillées
  • Capacités de recherche sémantique : En utilisant des embeddings vectoriels stockés dans Amazon OpenSearch Service, les équipes créatives effectuent des recherches par concept ou intention (p. ex. « style de rue Tokyo des années 90 ») plutôt que par noms de fichiers. Cela permet de débloquer des occasions de licence auparavant invisibles pour des séquences historiques et du contenu B-roll
  • Livraison prédictive de contenu avec Amazon SageMaker : En corrélant les modèles d’accès internes avec les signaux d’affaires externes (calendriers marketing ingérés via Amazon AppFlow), Amazon SageMaker prévoit la demande de contenu. Le système « préchauffe » automatiquement les ressources à partir de l’archivage profond avant les anniversaires de franchises ou les campagnes, éliminant ainsi les délais de production

Mise en œuvre technique

AI
  1. Le contenu sur le NAS est lu via NFS/SMB par un agent AWS DataSync local, qui parallélise les transferts, effectue une vérification d'intégrité de bout en bout et n’envoie que les blocs modifiés pour que les exécutions suivantes soient incrémentielles
  2. L’agent diffuse ces voies parallèles via TLS par l’entremise d’un circuit AWS Direct Connect, modulant la bande passante au besoin afin que le trafic de production ne soit pas affecté
  3. Au point de terminaison AWS, DataSync écrit dans le préfixe S3 cible tout en appliquant le marquage d’objet afin de gérer le cycle de vie, la recherche et la génération de rapports
  4. Les fichiers sont stockés de façon durable avec la gestion des versions et SSE-KMS. Chaque objet déposé génère un événement S3 (par EventBridge) qui déclenche les flux de travail en aval
    Chemin parallèle : Snowball Edge peut ingérer en lot les données en retard dans le même bucket/préfixe. Chemin parallèle : Snowball Edge peut ingérer en lot les données en retard dans le même bucket/préfixe
  5. Met en œuvre une architecture « Mezzanine » dans un bucket logique unique. Lors de l’ingestion, Step Functions déclenche Media Convert pour générer un proxy H.264 léger pour l’aperçu mondial instantané, stocké dans S3 Standard. Simultanément, le flux de travail effectue une transition « in-place » du Master Original haute résolution vers S3 Glacier Deep Archive (Master Vault) pour une conservation à long terme
  6. Orchestre Content Intelligence. Invoque Amazon Bedrock pour extraire les métadonnées descriptives (scène, acteur, sentiment) et Lambda pour les métadonnées techniques (codec, débit). Indexe ces actifs dans OpenSearch (Vector Store) pour la découverte sémantique
  7. Athena utilise le Glue Data Catalog pour exécuter des requêtes SQL directement sur S3 Warm, afin d’interroger les métadonnées
  8. QuickSight se connecte à Athena pour créer un tableau de bord – tendances d’ingestion, ratios warm↔cold, critères de restauration SLA, motifs d’accès et coûts/ROI sans extraire les données de S3
  9. Une tâche nocturne Step Functions orchestre la préparation des données via Athena pour assurer la gouvernance et invoque la notation ML afin de prédire les rappels probables et évaluer les politiques de cycle de vie. Applique les actions approuvées (pré-restauration vers Warm ; mise à jour des règles de cycle de vie), écrit un audit complet dans S3 et expose l’impact sur les économies & les SLA dans QuickSight. Des plafonds budgétaires + approbation humaine optionnelle sont appliqués
  10. Ingère les signaux externes via Athena dans SageMaker pour prédire les schémas de rappel et préchauffer les actifs à partir de Deep Archive avant le lancement des campagnes

La solution HCLTech va au-delà du simple stockage en déployant un « système d’exploitation média » modulaire qui gère les subtilités des flux de travail vidéo complexes :

1. La chaîne d’ingestion :

AWS DataSync via AWS Direct Connect gère des structures média complexes avec une vérification d’intégrité et ingère le contenu vers Amazon S3 Standard pour le traitement par IA. Des politiques de cycle de vie automatisées transfèrent ensuite de façon transparente les fichiers maîtres vers Amazon S3 Glacier Deep Archive pour un stockage optimisé sur le plan des coûts.

2. Architecture du flux de travail basée sur les proxies :

AWS Elemental MediaConvert génère des fichiers proxy légers H.264 lors de l’ingestion, qui demeurent dans Amazon S3 Standard afin d’offrir des capacités d’aperçu instantané. Les requêtes Amazon S3 Range Get permettent aux monteurs de restaurer des plages d’octets spécifiques des fichiers maîtres, réduisant ainsi les coûts de transfert de données tout en maintenant un accès rapide aux segments de contenu requis.

3. Curation de contenu optimisée par l’IA :

Les fonctions AWS Lambda extraient des métadonnées techniques incluant le codec, le débit d’images et l’information sur le débit de transmission du contenu ingéré. Amazon Bedrock effectue une analyse multimodale afin d’identifier les célébrités, objets et caractéristiques de scènes comme l’ambiance et l’action (par exemple, « une poursuite tendue dans le Tokyo pluvieux »). Ces informations sont converties en embeddings vectoriels pour permettre la recherche sémantique, permettant ainsi aux monteurs de rechercher par concept tel que « action à grande vitesse » et de découvrir des séquences qui n’avaient jamais été explicitement étiquetées avec ces termes.

4. Restauration prédictive avec Amazon SageMaker

AWS Step Functions déclenche chaque nuit des requêtes Amazon Athena pour analyser les patrons d’accès, tandis qu’Amazon AppFlow ingère des signaux d’affaires externes tels que les calendriers de marketing et les horaires de campagnes. Amazon SageMaker analyse ces ensembles de données combinés pour prédire la demande de contenu et préparer automatiquement à l’avance des ressources depuis Amazon S3 Glacier Deep Archive avant même que les équipes créatives n’en fassent la demande.

5. Coffre-fort de conformité immuable :

Nous mettons en place une architecture « compte de coffre-fort » où des copies de sauvegarde sont conservées dans un compte AWS distinct avec S3 Object Lock en mode Conformité. Même si l’utilisateur racine du compte principal est compromis, la copie du coffre-fort demeure intouchable et impossible à supprimer.

Architecture technique et services AWS

Services AWS utilisés dans la solution :

  1. AWS DataSync : Le moteur de transfert de données sécurisé gérant la migration à haute vitesse avec chiffrement de bout en bout et vérification d'intégrité parfaite au bit près
  2. Amazon S3 et Glacier Deep Archive : La base de stockage « Touch-and-Go » ; S3 Standard gère le traitement à chaud tandis que Deep Archive sert de « coffre-fort principal » au coût le plus bas
  3. AWS Elemental MediaConvert : Crée automatiquement des fichiers proxy H.264 légers pour un aperçu instantané, dissociant la découverte du fichier maître archivé
  4. AWS Step Functions : L’orchestrateur sans serveur qui gère le cycle d’ingestion, la logique de conformité et les flux de restauration asynchrones
  5. Amazon Bedrock Data Automation : Le moteur GenIA qui « surveille » les proxies vidéo pour extraire des informations multimodales telles que la détection de célébrités, d’objets et de scènes
  6. Amazon OpenSearch Service : Stocke des embeddings de vecteurs pour permettre la recherche sémantique, permettant aux éditeurs de trouver du contenu selon la « vibe » ou un concept plutôt que seulement par nom de fichier
  7. Amazon AppFlow : Ingère de façon sécurisée des signaux d’affaires externes (p. ex., calendriers marketing) pour alimenter le modèle prédictif de restauration
  8. Amazon Athena et AWS Glue : La couche de gouvernance qui structure les métadonnées et nettoie les journaux d’accès avant qu’ils n’atteignent le pipeline ML
  9. Amazon SageMaker : Prévoit la demande de récupération selon les signaux d’affaires afin de « préchauffer » les actifs depuis le coffre avant les campagnes
  10. Amazon QuickSight : Fournit des tableaux de bord d’analyse sur l’économie unitaire de stockage, les tendances d’ingestion et les SLA de récupération

Valeur pour les utilisateurs : Principaux avantages débloqués

  • Jusqu'à 90 % plus rapide de la mise en marché : Les éditeurs et les producteurs peuvent rechercher, prévisualiser et initier des restaurations en quelques minutes via un portail libre-service, éliminant ainsi les délais d'attente de 24 à 48 heures associés aux demandes de bande physique
  • Modèle OpEx prévisible : En éliminant le besoin de renouvellements de matériel à un million de dollars et de contrats de maintenance, la solution permet d’uniformiser la trésorerie. Les organisations paient seulement pour l'espace de stockage utilisé, en tirant parti de Deep Archive pour réduire les coûts opérationnels de 50 à 70 %
  • Aperçus instantanés : Des proxys H.264 légers restent dans le stockage actif (« hot storage »), permettant aux monteurs de visualiser 20 Po de contenu instantanément sans déclencher une restauration de coffre-fort
  • Atténuation des risques : Les « angles morts » des bandes sont éliminés. AWS CloudTrail consigne chaque demande d’accès, créant une piste d'audit immuable. Combiné à la durabilité S3 (11 neufs), le risque de perte ou de vol de données est pratiquement nul
  • Pérennité grâce à l’IA : Les archives ne sont plus un cimetière statique. C’est un lac de données prêt pour la prochaine vague d’innovation, comme l’utilisation de l’IA Générative pour générer automatiquement des bandes-annonces, résumer les images tournées quotidiennement ou identifier des occasions de monétisation dans la propriété intellectuelle de catalogue
  • Le moteur de « revenus perpétuels » : Transformez vos archives d’un centre de coûts en une vitrine de licences. En ayant des ressources indexées et prêtes pour le cloud, les équipes commerciales peuvent instantanément emballer des « Collections Rétro » pour délivrance de licences à des plateformes de médias sociaux ou des chaînes FAST
  • Durabilité en tant que service (archivage écologique) : Alignez-vous sur les objectifs corporatifs Net-Zéro. Passer de coffres à bandes sur site contrôlés par le climat (qui consomment constamment de l’énergie pour le refroidissement et le contrôle de l’humidité) à l’efficacité de l’infrastructure hyperscale d’AWS réduit considérablement l’empreinte carbone par téraoctet. Nous optimisons les régions de stockage en fonction de l’intensité carbone, vous aidant à déclarer des réductions d’émissions de portée 3 mesurables dans votre rapport annuel ESG
  • Sécurité des médias « Zero Trust » : À l’ère des fuites médiatiques à grand déploiement, notre solution applique les principes Zero Trust au contenu. Chaque visualisation, téléchargement ou aperçu est authentifié via IAM et enregistré dans CloudTrail. Contrairement à une bande physique posée sur un bureau, une ressource numérique dans ce système ne peut pas être déplacée sans laisser une empreinte numérique médico-légale

Appel à l’action : Arrêtez de stocker, commencez à monétiser !

Évaluer en quelques semaines :
Notre évaluation « Découverte des archives » analyse vos métadonnées et votre empreinte de stockage actuelles en 2 semaines pour bâtir un modèle TCO ROI.

Migration sans interruption :
Notre méthodologie « Tape-to-Cloud » de HCLTech assure que votre équipe de production peut continuer son travail pendant que nous transférons les données en arrière-plan.

« De la donnée sombre à la lumière : Auditez, soulevez et activez. »

  • Audit (évaluer) : Obtenez un modèle TCO et ROI en 2 semaines avec notre outil d’analyse de métadonnées non intrusif
  • Airlift (migrer) : Effectuez une migration sans interruption à l’aide de notre usine d’ingestion « Smart-Queue »
  • Activate (monétiser) : Activez le Générateur IA de contenu et commencez à accorder des licences pour votre historique

Prêt à monétiser votre historique?
Studios et diffuseurs, contactez-nous dès maintenant pour planifier une « Démonstration Mediq-IQ » et voir votre archive prendre vie.

Karthik Rajan

Coauteur

Karthik Rajan
Responsable de la pratique AWS APAC, Écosystème AWS HCLTech
Ong Jun Hao

Coauteur

Ong Jun Hao
Architecte de solutions AWS, écosystème AWS de HCLTech
Karthik Annamalaisamy

Coauteur

Karthik Annamalaisamy
Architecte principal de solutions, AWS
Maheshwaran Govindarajeswaran

Coauteur

Maheshwaran Govindarajeswaran
Architecte principal de solutions dans les médias et le divertissement, AWS

Découvrez une façon plus intelligente d’accéder au nuage

En savoir plus

Recevez les informations et mises à jour de HCLTech directement dans votre boîte de réception

Etiquettes
Partager sur
Nuage et écosystème AWS Blogues HCLTech Media-IQ: Turning the "digital attic" into an AI content engine on AWS