L’apprentissage automatique offre un aperçu haute définition de la façon dont les génomes s’organisent dans des cellules individuelles

À l'intérieur des limites microscopiques d'une seule cellule humaine, les plis et les arrangements complexes des faisceaux de protéines et d'ADN dictent le destin d'une personne : quels gènes sont exprimés, lesquels sont supprimés et, surtout, s'ils restent en bonne santé ou développent une maladie. Malgré l'impact potentiel de ces faisceaux sur la santé humaine, la science en sait peu sur la façon dont le repliement du génome se produit dans le noyau cellulaire et comment cela influence la façon dont les gènes sont exprimés. Mais un nouvel algorithme développé par une équipe du Computational Biology Department de l'Université Carnegie Mellon offre un outil puissant pour illustrer le processus à une résolution sans précédent.

Publicité

Les chromosomes sont constitués d’un complexe ADN-ARN-protéine appelé chromatine qui se replie et s’arrange pour s’adapter à l’intérieur du noyau cellulaire. Le processus influence la façon dont les gènes sont exprimés en rapprochant les éléments fonctionnels de chaque ingrédient, leur permettant d’activer ou de supprimer un trait génétique particulier.

L’algorithme, connu sous le nom de Higashi, est basé sur l’apprentissage de la représentation hypergraphique – la forme d’apprentissage automatique qui peut recommander de la musique dans une application et effectuer une reconnaissance d’objets 3D.  Ruochi Zhang, doctorant à l’École d’informatique, a dirigé le projet avec les candidats Ph.D Tianming Zhou, et Jian Ma, professeur de Biologie computationnelle de Ray et Stephanie Lane. Leur recherche a été publiée dans Nature Biotechnology et a été menée dans le cadre d’un centre de recherche multi-institutions cherchant à mieux comprendre à la fois la structure tridimensionnelle des noyaux cellulaires et comment les changements dans cette structure affectent les fonctions cellulaires dans la santé et la maladie. Le centre de 10 millions de dollars a été financé par les National Institutes of Health et est dirigé par la CMU, avec Ma comme chercheur principal. 

Zhang a nommé Higashi d’après un bonbon traditionnel japonais, poursuivant une tradition qu’il a commencée avec d’autres algorithmes qu’il a développés. “[Zhang] aborde la recherche avec passion mais aussi avec un sens de l’humour parfois”, a déclaré Ma.  Cet algorithme onctionne avec une technologie émergente connue sous le nom de Hi-C à cellule unique, qui crée des instantanés des interactions de la chromatine se produisant simultanément dans une seule cellule. L’algorithme est le premier outil à utiliser des réseaux de neurones sophistiqués sur des hypergraphes pour fournir une analyse haute définition de l’organisation du génome dans des cellules individuelles. Lorsqu’un graphe ordinaire joint deux sommets à une seule intersection, appelée arête, un hypergraphe joint plusieurs sommets à l’arête.

- Publicité -

Higashi fournit une analyse plus détaillée de l’organisation de la chromatine dans les cellules individuelles des tissus complexes et des processus biologiques, ainsi que la façon dont ses interactions varient d’une cellule à l’autre. Cette analyse permet aux scientifiques de voir les variations détaillées du repliement et de l’organisation de la chromatine, y compris celles qui peuvent être subtiles, mais importantes pour identifier les implications pour la santé. “La variabilité de l’organisation du génome a de fortes implications dans l’expression des gènes et l’état cellulaire”, a déclaré Ma.

L’algorithme de Higashi permet également aux scientifiques d’analyser simultanément d’autres signaux génomiques profilés conjointement avec le Hi-C unicellulaire. À terme, cette fonctionnalité permettra d’étendre les capacités de Higashi, ce qui arrive à point nommé compte tenu de la croissance des données monocellulaires que Ma s’attend à voir dans les années à venir grâce à des projets tels que le NIH 4D Nucleome Program auquel appartient son centre. Ce flux de données créera des opportunités supplémentaires pour concevoir davantage d’algorithmes qui feront progresser la compréhension scientifique de la façon dont le génome humain est organisé au sein de la cellule et de sa fonction dans la santé et la maladie. “C’est un domaine en évolution rapide”, a déclaré Ma. “La technologie expérimentale progresse rapidement, tout comme le développement informatique”.

Voir la publication

Zhang, R., Zhou, T. & Ma, J. Multiscale and integrative single-cell Hi-C analysis with Higashi. Nat Biotechnol (2021). https://doi.org/10.1038/s41587-021-01034-y

Publicité
Total
0
Share