Flux RSS du blog Google IA
Suivre
Polissage de génome de haute précision avec DeepPolisher : Améliorer les fondations de la recherche génomique
La compréhension de l'hérédité, des maladies et de l'évolution repose sur la déchiffrage du génome, codé par les bases d'ADN. Alors que les séquenceurs d'ADN lisent ces bases, atteindre une précision à grande échelle est difficile en raison de la taille minuscule des paires de bases. Créer un génome de référence presque parfait est crucial, car les erreurs d'assemblage peuvent entraver l'identification des gènes et conduire à des variants causant des maladies manqués. L'assemblage du génome implique de séquencer répétitivement le même génome pour corriger les erreurs de manière itérative. Cependant, les trois milliards de nucléotides du génome humain signifient que même des taux d'erreur faibles s'accumulent considérablement, limitant l'utilité.Pour répondre à ces défis, DeepPolisher, une méthode d'assemblage du génome open-source, a été développée pour améliorer la précision. Ce pipeline, décrit dans un article récent, réduit les erreurs d'assemblage de 50% et les erreurs d'indel de 70%, qui sont particulièrement perturbatrices pour l'identification des gènes. Différentes technologies de séquençage existent, la méthode d'Illumina améliorant le signal mais limitant la longueur de lecture. Les technologies de séquençage à lecture longue, initialement sujettes à erreur, ont été améliorées par les efforts collaboratifs de Pacific Biosciences et de Google, réduisant les taux d'erreur.DeepPolisher, adapté de DeepConsensus, utilise une architecture de transformateur entraînée sur un génome humain hautement caractérisé. Cette méthode identifie et corrige les erreurs résiduelles dans les assemblages du génome. DeepPolisher réduit considérablement les erreurs d'indel, cruciales pour éviter les problèmes d'annotation des gènes. L'outil améliore la qualité de l'assemblage du génome, démontrée par une augmentation des scores Q de Q66,7 à Q70,1 en moyenne.La deuxième version des données du Consortium de référence du pangenome humain a bénéficié de DeepPolisher, réduisant les erreurs et permettant un diagnostic plus précis des maladies génétiques à travers les ancestries diverses. En rendant DeepPolisher open-source, le but est de diffuser largement ces avancées au sein de la communauté scientifique.