Les réseaux neuronaux fonctionnent différemment de l’apprentissage automatique—et cette différence a un coût

Short Description
Les réseaux neuronaux peuvent permettre d’obtenir des résultats puissants grâce à l’IA en entreprise, mais ils nécessitent des données évolutives, une infrastructure GPU, de la gouvernance et une supervision opérationnelle continue.
S'abonner
Publish Date
5 min de lecture
Neha Kumari
Neha Kumari
Directeur(trice) adjoint(e), Fondation numérique, HCLTech
Publish Date
5 min de lecture
Banner Image
Qu'est-ce qu'un réseau neuronal?
Body

Dans la plupart des déploiements ratés d'IA en entreprise, l'organisation n'était pas structurée pour soutenir ce dont leurs réseaux neuronaux ont besoin : des données étiquetées à grande échelle, une infrastructure informatique de calibre GPU et une gouvernance continue des modèles. Comprendre ce que sont les réseaux neuronaux, comment ils apprennent et où ils échouent constitue la base d’un réussi.

Qu’est-ce qu’un réseau neuronal ?

C'est un modèle d’apprentissage automatique composé de nœuds interconnectés organisés en couches séquentielles, où chaque connexion porte un poids qui détermine la force de l'influence d'un nœud sur le suivant et chaque nœud applique une fonction d’activation pour décider si (et à quel point) transmettre un signal. Pensez-y comme à un système de points de décision disposés en profondeur : une couche d'entrée qui reçoit les données brutes, une ou plusieurs couches cachées qui transforment progressivement ces données en représentations abstraites et une couche de sortie qui produit une prédiction ou une classification. Les poids encodent ce que le réseau a appris ; les fonctions d'activation introduisent de la non-linéarité, permettant au réseau de modéliser des relations qu'aucune formule simple ne pourrait saisir.

Comment les réseaux neuronaux apprennent : entraînement et rétropropagation

Dans l’entraînement supervisé en 4 étapes, des exemples étiquetés sont utilisés pour ajuster les poids du réseau jusqu’à ce que ses prédictions s’alignent suffisamment avec les résultats connus. Chaque étape introduit des implications sur les ressources qui comptent vraiment en planification d’entreprise :

  1. Propagation avant : Les données d’entrée traversent le réseau couche par couche, chaque nœud calculant une somme pondérée de ses entrées et transmettant le résultat à travers sa fonction d’activation. La couche finale produit une prédiction.
  2. Calcul de la perte : Une fonction de perte mesure l’écart entre la prédiction du réseau et l’étiquette correcte, déterminant finalement ce que le réseau optimise.
  3. Rétropropagation : Les signaux d’erreur se déplacent vers l’arrière dans le réseau, calculant la contribution de chaque poids à la perte totale.
  4. Mise à jour des poids : Les poids sont ajustés progressivement pour réduire la perte. Bien que chaque itération soit peu coûteuse, l’ensemble de l’entraînement ne l’est pas.

Les quatre types de réseaux neuronaux et leurs applications en entreprise

ArchitectureCaractéristique structurelle cléApplication en entreprise
Réseau neuronal convolutionnelLes couches convolutionnelles analysent spatialement les données d’entrée, extrayant des caractéristiques locales comme les contours et les textures avant de transmettre des représentations compressées (p. ex., images, images vidéo) aux couches plus profondesContrôle de la qualité
Réseau neuronal récurrentLes connexions récurrentes transportent l’information vers l’avant à travers les étapes temporelles, donnant au réseau une forme de mémoire sur les séquences et contrôlant ce qu’il retient ou rejette sur de plus longues séquencesMaintenance prédictive
TransformeurLes mécanismes d’auto-attention permettent à chaque position dans une séquence de tenir compte de toutes les autres positions simultanément, capturant les dépendances à longue distance sans traiter les jetons de façon séquentielleAnalyse de contrats
Réseau antagoniste génératifDeux réseaux—un générateur et un discriminateur—s’entraînent en opposition et s’améliorent par la compétition : le générateur produit des données synthétiques, le discriminateur tente de les distinguer des données réellesAugmentation d’imagerie médicale

Réseaux neuronaux comparés à l’apprentissage automatique traditionnel : Quand utiliser quoi

FacteurLes réseaux neuronaux sont préférés lorsque :L’apprentissage automatique traditionnel est préféré lorsque :
Volume de donnéesLes données d’entraînement étiquetées exigent plus de 100 000 exemples et une infrastructure de collecte de données est déjà en placeLes données étiquetées sont limitées, coûteuses à produire ou restreintes par la rareté dans le domaine
InterprétabilitéL’exactitude prédictive est l’objectif principal et le cheminement décisionnel ne nécessite pas une explication prête pour auditLe raisonnement du modèle doit être traçable—pour l’examen réglementaire, l’audit interne ou la reddition de comptes envers les parties prenantes
Coût d’entraînementUne infrastructure GPU est disponible et le gain de performance justifie des cycles d’entraînement de plusieurs semaines et des frais récurrents de ré-entraînementL’entraînement doit s’exécuter sur un ordinateur standard, les délais de déploiement sont courts ou la fréquence de ré-entraînement rend le coût GPU prohibitif
Complexité du cas d’utilisationLe problème implique des données non structurées—images, texte, audio, flux de capteurs—où l’ingénierie manuelle des caractéristiques serait incomplète ou irréalisteLe problème implique des données tabulaires structurées avec des relations de caractéristiques bien comprises et un espace de sortie clair et limité
Délai de rentabilisationL’organisation peut absorber un cycle de développement plus long en échange d’un modèle capable de gérer de la complexité que des approches plus simples ne peuvent pasLa rapidité de déploiement est la principale contrainte et la profondeur de représentation qu’offrent les réseaux neuronaux n’est pas requise

Applications réelles des réseaux neuronaux en entreprise

Services financiers : Les motifs de fraude évoluent continuellement et les fraudeurs s’adaptent aux logiques de détection connues. Les réseaux neuronaux basés sur les graphes répondent à ce défi en modélisant simultanément les relations transactionnelles entre comptes, appareils et séquences comportementales pour identifier des motifs anormaux qu’aucune transaction isolée ne révélerait.

Santé : Les CNN entraînés sur des bibliothèques de scans étiquetés peuvent signaler des résultats candidats pour révision humaine, augmentant ainsi la charge des radiologistes, réduisant le temps passé sur les cas de routine et dirigeant l’attention experte là où elle est nécessaire.

Fabrication : Les RNN entraînés sur des données de capteurs d’équipement apprennent les signatures temporelles précédant les pannes, permettant aux équipes d’entretien d’agir sur des dégradations prédites plutôt que sur des pannes constatées.

Télécommunications : Le comportement des clients précédant l’annulation suit des motifs répartis sur des mois de données d’utilisation, et non un seul événement déclencheur. Les architectures de transformeurs appliquées aux séquences d’usage client captent les dépendances à long terme dans les données comportementales, permettant une identification précoce des clients à risque pour une intervention de rétention.

Défis du déploiement des réseaux neuronaux à l’échelle de l’entreprise

  • Coût informatique : L’entraînement des réseaux profonds nécessite des grappes de GPU à un coût 10 fois supérieur à celui des charges de travail d’apprentissage automatique traditionnelles équivalentes, en plus de l’inférence à l’échelle de l’entreprise, des cycles de réentraînement et de la gestion des versions de modèles qui génèrent tous des frais continus.
  • Interprétabilité : Dans les secteurs réglementés où les décisions qui touchent des personnes exigent une explication, l’architecture opaque des réseaux de neurones crée un risque de non-conformité que les gains de performance ne justifient pas automatiquement.
  • Exigences en matière de données : Les réseaux de neurones exigent des données étiquetées suffisamment diversifiées pour couvrir la distribution que le modèle rencontrera en production, suffisamment stables pour que la distribution d’entraînement ne diverge pas des conditions de déploiement et suffisamment propres pour que les erreurs d’étiquetage ne se propagent pas lors de l’entraînement.
  • Dérive du modèle : Lorsque la distribution statistique des données de production s’écarte de la distribution d’entraînement, la performance du modèle se détériore. La contrainte technique est un changement de distribution ; l’impact commercial, c’est qu’un modèle certifié pour le déploiement peut produire des résultats non fiables quelques mois plus tard sans déclencher d’alerte.

Le déploiement de réseaux neuronaux est en fin de compte un engagement organisationnel autant que technique. Les exigences en matière de calcul, de talents et de flux de données nécessaires au fonctionnement de ces modèles ne se répartissent pas naturellement entre des unités d'affaires indépendantes — elles tendent à se centraliser, ce qui génère des frais de coordination.

ÉTIQUETTES:
Partager sur

À propos le author

Neha Kumari

Neha Kumari

Directeur(trice) adjoint(e), Fondation numérique, HCLTech

Description

Assure le marketing stratégique et des récits percutants grâce à des campagnes influentes qui renforcent l’autorité de la marque, influencent les marchés et soutiennent la croissance de l’entreprise.

IA IA et GenIA Bibliothèque de connaissances Les réseaux neuronaux fonctionnent différemment de l’apprentissage automatique—et cette différence a un coût