Utilisation de l'apprentissage automatique pour obtenir des informations sur la R&D médicale pour un géant pharmaceutique mondial
Introduction
Notre client, une entreprise pharmaceutique et biotechnologique multinationale dont le siège social est en Hongrie, exploite le plus grand centre de recherche pharmaceutique de la région, a contacté HCLTech pour utiliser la science des données afin de créer une solution permettant de recueillir des informations à un niveau de spécificité supérieur.
Le défi
Manque de technologie établie
Le client avait besoin d'une façon de quantifier les propriétés d'un réseau mitochondrial à l'intérieur des neurones afin de permettre une analyse plus efficace des médicaments pour diverses maladies neurologiques. Ils voulaient un outil qui pouvait automatiquement identifier les cellules/tissus sains et endommagés, puisqu'il n'existait aucun outil pour ce but.
L’objectif
Créer un outil pour évaluer la santé des cellules biologiques
Le client a identifié trois livrables clés pour le projet qui leur permettraient d’obtenir les informations nécessaires pour optimiser leurs produits.
- Le besoin de développer une méthodologie pour la détection automatique et fiable des mitochondries dans des images de microscopie confocale 3D haute résolution — un processus communément appelé segmentation
- Un moyen de quantifier les propriétés d’un réseau mitochondrial à partir de la segmentation
- Enfin, la solution devait permettre aux chercheur·euse·s de déterminer si les cellules étaient saines ou endommagées en se basant sur les propriétés du réseau mitochondrial
Il y avait donc un besoin de développer des ensembles d’outils entièrement nouveaux pour atteindre les objectifs visés.

La solution
Quantifier les propriétés des réseaux mitochondriaux
Le projet a pris forme sous la forme d’un programme de preuve de concept de R&D impliquant beaucoup d’expérimentation. L’équipe HCLTech s’est appuyée sur l’environnement informatique existant du client comme référence pour développer une méthodologie que les biologistes (utilisateurs finaux) peuvent utiliser sans connaissances en science des données ou en programmation. Avec cette exigence en tête, l’équipe a conçu une solution suffisamment flexible pour répondre aux besoins futurs, permettant aux biologistes d’y apporter de légères modifications.
- L’équipe s’est principalement concentrée sur la quantification des propriétés d’un réseau mitochondrial et son utilisation pour évaluer la santé des cellules.
- Nous avons développé des algorithmes robustes et interprétables à l’aide d’un modèle d’apprentissage automatique capable de traiter la nature « bruyante » des données d’entraînement. L’algorithme a trouvé des motifs plus typiques dans les réseaux mitochondriaux sains ou endommagés.
- L’équipe a validé les résultats à l’aide d’un jeu de données test pour une série d’images 3D créées spécialement pour ce projet.
- Tout au long du projet, les biologistes du côté client ont apporté des connaissances approfondies en la matière, essentielles à la réussite du projet. Ils ont mené toutes les expériences et fourni les images de microscopie confocale 3D, en présélectionnant les échantillons pour que les algorithmes puissent être entraînés sur des échantillons où l’altération était claire. Ils ont également pu identifier les objectifs à atteindre avec la nouvelle méthodologie et ont évalué les masques — versions binaires d’une image montrant l’emplacement uniquement des mitochondries dans l’image — et les différents motifs appris à partir des données.
- La solution a pris la forme d’un code Python permettant de calculer les caractéristiques géométriques des mitochondries et d’un modèle d’arbre de décision/algorithme d’apprentissage automatique ayant appris les différences dans les principaux motifs des cellules saines et endommagées.
- Le code et l’algorithme ont fourni une solution raisonnablement pérenne, car ils ne nécessitaient aucune configuration manuelle avant l’exécution pour classer de nouvelles images. Après que l’équipe HCLTech a remis le code original, l’équipe du client a utilisé un jeu de données interne distinct pour créer le modèle final sur lequel l’entreprise s’appuierait pour de futures recherches.
L'impact
Aperçus améliorés dans la R&D des produits
- En deux mois, avec le soutien du client, HCLTech a créé le premier ensemble d'outils d'apprentissage automatique pour imagerie 3D entièrement fonctionnel et validé pour quantifier les propriétés d'un réseau mitochondrial et déterminer si les cellules sont saines ou altérées.
- L'équipe a également obtenu des résultats prometteurs dans la création d'un système automatique de détection des mitochondries dans les images de microscopie confocale 3D haute résolution. Bien qu'un ensemble de données plus large et un post-traitement d'image plus efficace soient nécessaires pour concrétiser pleinement cette partie de la solution et la rendre généralement applicable, la méthodologie créée représentait une avancée majeure par rapport aux solutions antérieures lorsqu'elle était utilisée sur les données du client.
- Comparativement aux solutions basées sur des images 2D, la nouvelle méthodologie n'exigeait pas de règles d'experts pour la classification, mais pouvait plutôt apprendre des modèles à partir des données et utiliser des informations auparavant indisponibles aux biologistes.
- Le client peut désormais appliquer le modèle ML sur de grands ensembles d'images afin de juger automatiquement et efficacement si un traitement particulier avait été couronné de succès et a conclu que cet outil serait essentiel pour évaluer les effets des candidats-médicaments sur les réseaux mitochondriaux neuronaux.
