Google veröffentlicht LLM-Selbstkorrektur-Algorithmus SCoRe

Forscher bei Google DeepMind haben kürzlich ein Papier zum Thema "Self-Correction via Reinforcement Learning" (SCoRe) veröffentlicht, einer Technik, um die Fähigkeit großer Sprachmodelle (LLMs) zu verbessern, sich selbst zu korrigieren, wenn sie mathematische oder Programmierprobleme lösen. Modelle, die mit SCoRe feinjustiert wurden, erzielen im Vergleich zu Baseline-Modellen bessere Leistungen bei mehreren Benchmarks. Von Anthony Alford

infoq.com

Google Publishes LLM Self-Correction Algorithm SCoRe

RSS Hunter

2024-10-15

Create attached notes ...