RSS VentureBeat
Folgen
Forscher finden heraus, dass das Neutrainieren nur kleiner Teile von KI-Modellen Kosten senken und Vergessen verhindern kann.
Unternehmen stehen oft vor einem Problem, wenn sie große Sprachmodelle (LLMs) feinabstimmen, bei dem die Modelle zuvor erlernte Fähigkeiten verlieren, ein Phänomen, das als katastrophales Vergessen bekannt ist. Forscher der University of Illinois Urbana-Champaign haben eine neue Methode vorgeschlagen, um dies zu vermeiden, indem sie sich auf die Neuausbildung nur schmaler Teile des LLM konzentrieren. Dieser Ansatz zielt darauf ab, die Rechenkosten zu senken und das vorhandene Wissen des Modells zu erhalten. Das Team geht davon aus, dass katastrophales Vergessen kein echter Gedächtnisverlust, sondern eine Nebenwirkung der Bias-Drift ist. Sie untersuchten dies, indem sie zwei Vision-Language-LLMs, LLaVA und Qwen 2.5-VL, für bestimmte Aufgaben trainierten und ihre Leistung an zurückgehaltenen Benchmarks beobachteten. Überraschenderweise stellten sie fest, dass die Feinabstimmung nur der Self-Attention-Projektionsschichten zum Erlernen neuer Aufgaben führte, ohne dass die Leistung bei bestehenden Aufgaben abfiel. Die Forschung deutet darauf hin, dass die Feinabstimmung des Multi-Layer-Perzeptrons (MLP) zu Output-Bias und vorübergehendem Vergessen führen kann. Durch selektives Feinabstimmen bestimmter MLP-Komponenten bei gleichzeitiger Einfrierung anderer erreichten sie effektives Lernen mit minimalem Vergessen. Diese schmale Neuausbildungsmethode bietet eine kostengünstigere und kontrollierbarere Möglichkeit, LLMs zu aktualisieren. Während sich die aktuelle Forschung auf Vision-Language-Modelle beschränkt, wird erwartet, dass die Ergebnisse auf andere LLMs über verschiedene Modalitäten hinweg anwendbar sind.