Flux RSS de la revue Quanta
Suivre
Comment la distillation rend les modèles d'IA plus petits et moins chers
La technique fondamentale permet aux chercheurs d'utiliser un grand modèle "professeur" coûteux pour former un modèle "étudiant" à moindre coût.