Сообщество RSS DEV

ПротБФН: Байесовская фундаментальная модель для проектирования последовательности белков

В недавней статье в Nature Communications представлен ProtBFN, мощная базовая модель для проектирования последовательностей белков с 650 миллионами параметров. ProtBFN использует байесовские потоковые сети для генерации разнообразных и структурно связных последовательностей без использования явных структурных данных. Модель предлагает безусловное и условное генерирование белков, превосходя ведущие автoreгрессионные и диффузионные модели. Она производит последовательности, соответствующие естественной длине и распределению аминокислот. Также доступна тонко настроенная версия, AbBFN, для тяжелых цепей антител, продемонстрированная на пространстве наблюдаемых антител (OAS). ProtBFN позволяет проводить проектирование с нулевым выстрелом, производя действительные белки без повторной тренировки, что делает его универсальным для терапевтического и промышленного проектирования ферментов. Вероятностные потоковые сети модели обеспечивают как генеративную гибкость, так и структурную последовательность, соответствуя основным потребностям белковой инженерии. Открытая модель может быть установлена с помощью pip, что позволяет исследователям тестировать ее на пользовательских задачах, таких как прогнозирование стабильности, проектирование связывания или создание де-ново терапевтических белков. В настоящее время ведутся работы по расширению предварительно обученных вариантов и метрик оценки. ProtBFN имеет потенциал существенно повлиять на белковую инженерию и проектирование.
dev.to
# ProtBFN: Bayesian Foundation Model for Protein Sequence Design
Create attached notes ...