Flux RSS Techmeme

Le groupe de recherche à but non lucratif sur l'IA, EleutherAI, publie Common Pile v0.1, un ensemble de données de 8 To de texte sous licence et de domaine public, destiné aux modèles d'IA, qu'il présente comme l'un des plus importants (Kyle Wiggers/TechCrunch).

Kyle Wiggers / TechCrunch : L'organisme de recherche en intelligence artificielle EleutherAI publie la pile commune v0.1, un ensemble de données de 8 To de texte licencié et de domaine ouvert pour les modèles d'IA qu'il dit être l'un des plus grands — EleutherAI, une organisation de recherche en intelligence artificielle, a publié ce qu'elle affirme être l'une des plus grandes collections de texte licencié et de domaine ouvert pour l'entraînement des modèles d'.
www.techmeme.com
AI research nonprofit EleutherAI releases the Common Pile v0.1, an 8TB dataset of licensed and open-domain text for AI models that it says is one of the largest (Kyle Wiggers/TechCrunch)
Create attached notes ...