RSS DEV-Gemeinschaft

# ProtBFN: Bayes'sche Grundmodell für das Design von Proteinquenzfolgen

Ein kürzlich in Nature Communications veröffentlichter Artikel stellt ProtBFN vor, ein leistungsfähiges Grundmodell für die Proteinquenzdesign mit 650 Millionen Parametern. ProtBFN verwendet Bayes'sche Flussnetzwerke, um diverse und strukturell kohärente Sequenzen zu generieren, ohne explizite strukturelle Daten zu benötigen. Das Modell bietet unbedingte und bedingte Proteingenerierung und übertrifft führende autoregressive und Diffusionsmodelle. Es produziert Sequenzen, die natürliche Längen und Aminosäuredistributionen aufweisen. Eine fein abgestimmte Variante, AbBFN, ist auch für schwere Antikörperketten verfügbar, wie am Beispiel des Beobachteten Antikörper-Raums (OAS) demonstriert wurde. ProtBFN ermöglicht Zero-Shot-Design, produziert gültige Proteine ohne Neuausbildung, was es vielseitig für therapeutische und industrielle Enzymdesign einsetzbar macht. Die probabilistischen Flussnetzwerke des Modells bieten sowohl generative Flexibilität als auch strukturelle Konsistenz, was den Kernbedürfnissen der Proteintechnik entspricht. Das open-source-Modell kann über pip installiert werden, damit Forscher es auf benutzerdefinierten Aufgaben wie Stabilitätsvorhersage, Bindungsdesign oder de-novo-Therapeutik-Proteinschöpfung testen können. Gemeinschaftsbeiträge sind im Gange, um vortrainierte Varianten und Bewertungsmetriken zu erweitern. ProtBFN hat das Potenzial, die Proteintechnik und -design signifikant zu beeinflussen.
favicon
dev.to
# ProtBFN: Bayesian Foundation Model for Protein Sequence Design
Create attached notes ...