RSS DEV コミュニティ

# ProtBFN: タンパク質シーケンスデザインのためのベイズ基礎モデル

Nature Communications において最近発表された論文では、650 million パラメーターの強力な基礎モデルである ProtBFN を紹介しています。このモデルは、明示的な構造データに依存せずに、多様かつ構造的に整合的な蛋白質シーケンスを生成するために、Bayesian Flow Networks を使用しています。 ProtBFN は、条件付きおよび無条件の蛋白質生成を実現し、先行する自己回帰モデルや拡散モデルを上回り、自然長やアミノ酸分布に一致するシーケンスを生成しています。また、抗体重鎖に対する fine-tuned バリアントである AbBFN もあり、Observed Antibody Space (OAS) でデモンストレーションされています。 ProtBFN は、再トレーニングなしで有効な蛋白質を生成するゼロショットデザインを可能にし、治療や工業酵素デザインにおいて非常に汎用的です。モデル内の確率的フローネットワークは、生成の柔軟性と構造的一貫性を両立させ、蛋白質エンジニアリングの核心的なニーズに合致しています。このオープンソースモデルは、パイプインストール可能であり、調査者がカスタムタスク seperti 安定性予測、結合デザイン、デノボー療法蛋白質創造に対してベンチマークを実行することができます。コミュニティーの貢献により、事前トレーニングされたバリアントや評価メトリクスの拡張が進行中です。 ProtBFN は、蛋白質エンジニアリングとデザインに大きな影響を与える可能性があります。
favicon
dev.to
# ProtBFN: Bayesian Foundation Model for Protein Sequence Design
Create attached notes ...