Un algorithme capable d’analyser des centaines de millions de séquences génétiques a identifié des gènes et des enzymes coupant l’ADN extrêmement rares dans la nature | Source : Nature, doi: 10.1038/d41586-023-03697-w.
CRISPR-Cas9 est surtout connu comme outil de laboratoire pour modifier l’ADN, mais sa fonction naturelle fait partie du système immunitaire qui aide certains micro-organismes à combattre les virus. Aujourd’hui, les chercheurs ont utilisé un algorithme pour trier des millions de génomes afin de trouver de nouveaux types rares de système CRISPR qui pourraient éventuellement être adaptés en outils d’édition du génome. «Nous sommes tout simplement étonnés par la diversité des systèmes CRISPR», déclare Feng Zhang, biochimiste au Massachusetts Institute of Technology de Cambridge et co-auteur d’un article du 23 novembre dans Science décrivant les systèmes.1 «Faire cette analyse nous permet en quelque sorte de faire d’une pierre deux coups : à la fois étudier la biologie et aussi potentiellement trouver des choses utiles».
Les bactéries unicellulaires et les archées utilisent les systèmes CRISPR pour se défendre contre les virus appelés bactériophages. Les systèmes comportent généralement deux parties : des molécules «d’ARN guide» qui reconnaissent et se lient à l’ADN ou à l’ARN du phage, et des enzymes qui coupent ou interfèrent d’une autre manière avec le matériel génétique au site indiqué par l’ARN guide. Jusqu’à présent, les chercheurs avaient identifié six types de systèmes CRISPR, désignés I à VI. Ceux-ci ont des propriétés différentes, notamment le type d’enzyme qu’ils utilisent et la manière dont ils reconnaissent, se lient et coupent l’ARN ou l’ADN. Le système CRISPR-Cas9 couramment utilisé pour le génie génétique est classé comme type II, mais les caractéristiques d’autres types de CRISPR pourraient les rendre utiles pour d’autres applications.
Séquences similaires
Pour trouver divers systèmes CRISPR dans la nature, Zhang, le bio-ingénieur Han Altae-Tran du MIT et leurs collègues ont développé un algorithme appelé FLSHclust, qui analyse les séquences génétiques dans les bases de données publiques. Ces bases de données contiennent des centaines de milliers de génomes de bactéries et d’archées, des centaines de millions de séquences qui n’ont pas été liées à une espèce particulière et des milliards de gènes codant pour des protéines. FLSHclust a découvert les gènes associés à CRISPR en recherchant des similitudes entre les séquences génétiques et en les regroupant en environ 500 millions de groupes. En examinant la fonction prévue des clusters, les chercheurs ont découvert environ 130 000 gènes associés d’une manière ou d’une autre à CRISPR, dont 188 n’avaient jamais été observés auparavant, et en ont testé plusieurs en laboratoire pour découvrir ce qu’ils font. Leurs expériences révèlent diverses stratégies utilisées par les systèmes CRISPR pour attaquer les bactériophages, notamment le déroulement de la double hélice de l’ADN et la coupure de l’ADN de manière à permettre l’insertion ou la suppression de gènes. Ils ont également identifié des fragments d’ADN «anti-CRISPR» qui pourraient aider un phage à échapper aux défenses bactériennes.
Parmi les nouveaux gènes figurait le code d’un système CRISPR totalement inconnu ciblant l’ARN, que l’équipe a surnommé type VII. Le co-auteur Eugene Koonin, biologiste au Centre national d’information sur la biotechnologie à Bethesda, dans le Maryland, affirme qu’il est de plus en plus difficile de trouver de nouveaux systèmes CRISPR. Le type VII – et tous les autres types qui n’ont pas encore été identifiés – doit être de nature extrêmement rare, ajoute-t-il. « Il faudra probablement des efforts monumentaux pour trouver le prochain type ». Difficile de savoir si certains types de systèmes CRISPR sont rares parce qu’ils ne sont généralement pas utiles aux micro-organismes ou s’ils sont spécifiquement adaptés à un organisme qui vit dans un environnement particulier, explique Christine Pourcel, microbiologiste à l’université Paris-Saclay. Elle ajoute que, comme les bases de données génétiques utilisées dans l’étude incluent des fragments de génomes qui ne sont pas liés à des organismes spécifiques, il sera difficile d’étudier les rôles de certains des nouveaux systèmes.
Une récolte impressionnante
L’algorithme lui-même constitue une avancée majeure dans la mesure où il permettra aux chercheurs de rechercher d’autres types de protéines d’une espèce à l’autre, explique Chris Brown, biochimiste à l’Université d’Otago à Dunedin, en Nouvelle-Zélande. « Je suis impressionné par ce qu’ils ont pu faire », dit-il. « C’est un trésor pour les biochimistes », reconnaît Lennart Randau, microbiologiste à l’Université de Marburg en Allemagne. La prochaine étape, dit-il, consistera à déterminer les mécanismes par lesquels les enzymes et les systèmes fonctionnent, et comment ils pourraient être adaptés au génie biologique. Brown dit que certaines protéines CRISPR découpent l’ADN au hasard et sont inutiles pour l’ingénierie. Mais ils sont si précis dans la détection des séquences d’ADN ou d’ARN qu’ils pourraient constituer de bons outils de diagnostic ou de recherche.
Il est trop tôt pour dire si les systèmes CRISPR de type VII ou l’un des autres gènes identifiés par FLSHclust seront utiles au génie génétique, explique Altae-Tran, mais ils possèdent certaines propriétés qui pourraient être utiles. Le type VII, par exemple, ne concerne que très peu de gènes qui pourraient facilement s’insérer dans un vecteur viral et être délivrés dans les cellules. En revanche, certains des autres systèmes découverts par l’équipe contiennent de très longs ARN guides, leur permettant potentiellement de cibler des séquences génétiques particulières avec une précision sans précédent.
Note : 1 Altae-Tran, H. et al. Sciences 382, eadi1910 (2023).