Un nouveau cadre d’IA pourrait accélérer les nouvelles thérapies

LaCasadeGoethe / Pixabay

Source: LaCasadeGoethe / Pixabay

La montée en puissance de l’apprentissage automatique de l’intelligence artificielle (IA) a un impact sur la génomique, la biotechnologie, les produits pharmaceutiques et les sciences de la vie. Dans une étude publiée lundi dans Intelligence artificielle de la nature, une équipe de chercheurs de l’Université de Californie à San Diego (UCSD) dirigée par Melissa Gymrek a créé un cadre d’apprentissage automatique d’IA pour permettre des informations génomiques sur la liaison des facteurs de transcription (TF) – un cadre qui pourrait un jour aider à accélérer la médecine de précision et le développement de nouveaux traitements pour les maladies.

«Dans l’ensemble, notre étude fournit un cadre d’apprentissage automatique précieux pour aider à décoder les règles par lesquelles les TF lient leurs sites cibles et à identifier les nucléotides non codants spécifiques ayant les effets les plus forts sur la liaison», ont écrit Gymrek et son équipe de recherche.

Gymrek a été nommée à «Forbes 30 Under 30: Science» en 2017 pour ses réalisations scientifiques qui incluent un algorithme breveté qui permet aux scientifiques de rechercher l’impact des segments génétiques sur les traits humains. La mission du Gymrek Lab de l’UCSD est de rechercher les variations dans les séquences d’ADN pouvant conduire à des maladies en développant des outils de calcul. Parmi les autres chercheurs de l’UCSD qui ont participé à l’étude figurent Hao Su, Cynthia Wu, Hanquing Zhao, Michael Lamkin et An Zheng.

Un génome fait référence à toutes les informations génétiques d’un organisme qui sont stockées dans des chromosomes contenant de l’ADN. Le corps humain a 23 paires de chromosomes. Il y a environ 20 500 gènes dans les gènes humains, selon le Human Genome Project, un effort de recherche mondial mené entre 1990 et 2003 pour déterminer la séquence des trois milliards de paires de bases chimiques qui composent l’ADN humain.

A lire aussi  Comment détourner votre attention ... de l'incendie de la benne à ordures

L’activité génique est contrôlée par des facteurs de transcription, des protéines qui ont généralement une région de liaison à l’ADN qui contrôle si un gène est «activé» ou «désactivé». Ces protéines peuvent activer ou réprimer la transcription, processus par lequel l’ADN d’un gène est copié dans une molécule d’ARN.

Par exemple, le syndrome de Rett, un trouble du développement neurologique, est attribué au dysfonctionnement d’un répresseur transcriptionnel appelé MeCP2, selon une étude publiée dans Opinion actuelle en génétique et développement.

Selon une étude européenne sur le diabète néonatal et le développement pancréatique, le diabète de la maturité des jeunes est causé par des mutations du régulateur transcriptionnel HNF1ß (TCF2).

La dystrophie cornéenne endothéliale de Fuch (FECD), une maladie oculaire, est due à l’expansion de CTG TNR (CTG trinucleotide repeat) dans l’intron 3 du facteur de transcription TCF4; et peut augmenter le risque de développer un trouble bipolaire, selon différentes études européennes.

Les facteurs de transcription sont également un domaine d’intérêt dans la recherche sur le cancer car ils peuvent jouer un rôle dans la suppression ou la promotion des tumeurs.

Les chercheurs de l’UCSD ont créé un cadre d’apprentissage automatique appelé AgentBind en développant DeepSEA, composé de trois couches de réseau neuronal convolutif avec une couche entièrement connectée, et DanQ, qui est une combinaison d’un réseau neuronal convolutif et d’un réseau neuronal récurrent.

«Nous présentons ici un cadre d’apprentissage automatique tirant parti des architectures de réseau neuronal convolutif existantes et des techniques d’interprétation de modèle de pointe pour identifier, visualiser et interpréter les caractéristiques de contexte les plus importantes pour déterminer l’activité de liaison pour un TF particulier», ont écrit les chercheurs.

A lire aussi  Écoute authentique : conseils pour récupérer un art perdu

Ils ont utilisé l’apprentissage par transfert pour rendre la formation plus efficace en utilisant moins de données. Le réseau de neurones convolutifs est formé sur ChIP-seq et DNAseI-seq. Ensuite, les chercheurs ont appliqué Grad-CAM, une méthode post-analytique pour les réseaux de neurones, pour «calculer des scores d’importance pour les régions de contexte des motifs de liaison à une résolution de paire de bases unique».

«Dans l’ensemble, notre cadre permet de nouvelles connaissances sur les caractéristiques de séquence déterminant la liaison TF et identifie des variantes non codantes spécifiques présentant une pertinence potentielle pour la maladie», ont écrit les chercheurs.

Les facteurs de transcription altérés ou mutés peuvent provoquer des maladies auto-immunes, des problèmes cardiovasculaires, le cancer et d’autres maladies. Avec ce nouveau cadre d’apprentissage automatique de l’IA pour la liaison des facteurs de transcription, les chercheurs disposent d’une nouvelle méthode pour appliquer des technologies innovantes afin de comprendre le processus de la maladie et d’accélérer les thérapies futures.

Copyright © 2021 Cami Rosso Tous droits réservés.