Высокоточный полировка генома ... Заметка
RSS Блог Google AI

Высокоточный полировка генома с DeepPolisher: Улучшение основы геномных исследований

Понимание наследственности, болезней и эволюции зависит от расшифровки генома, закодированного в основаниях ДНК. Хотя секвенаторы ДНК считывают эти основания, достижение точности в больших масштабах затруднено из-за крошечного размера пар оснований. Создание почти идеального референсного генома имеет решающее значение, поскольку ошибки сборки могут препятствовать идентификации генов и приводить к пропуску вариантов, вызывающих заболевания. Сборка генома включает многократное секвенирование одного и того же генома для постепенного исправления ошибок. Однако три миллиарда нуклеотидов генома человека означают, что даже небольшие частоты ошибок накапливаются значительно, ограничивая полезность.Для решения этих проблем был разработан DeepPolisher, метод сборки генома с открытым исходным кодом, для повышения точности. Этот конвейер, описанный в недавней статье, снижает ошибки сборки на 50% и ошибки вставки/делеции (инделы) на 70%, которые особенно нарушают идентификацию генов. Существуют различные технологии секвенирования, при этом метод Illumina улучшает сигнал, но ограничивает длину считывания. Технологии секвенирования длинных считываний, изначально подверженные ошибкам, были улучшены совместными усилиями Pacific Biosciences и Google, снизив частоту ошибок.DeepPolisher, адаптированный из DeepConsensus, использует архитектуру Transformer, обученную на хорошо охарактеризованном человеческом геноме. Этот метод идентифицирует и исправляет оставшиеся ошибки в сборках генома. DeepPolisher значительно снижает ошибки инделов, что важно для предотвращения проблем с аннотацией генов. Инструмент улучшает качество сборки генома, что подтверждается увеличением Q-оценок в среднем с Q66.7 до Q70.1.Второй выпуск данных Консорциума референсного пангенома человека выиграл от использования DeepPolisher, что позволило снизить ошибки и обеспечить более точную диагностику генетических заболеваний у людей разного происхождения. Предоставляя DeepPolisher с открытым исходным кодом, ставится цель широко распространить эти достижения в научном сообществе.
CdXz5zHNQW_4NEnms7GRh.png