Kyle Wiggers / TechCrunch:
Die gemeinnützige AI-Forschungsorganisation EleutherAI veröffentlicht den Common Pile v0.1, ein 8TB-Datensatz lizenzierter und offener Texte für KI-Modelle, den sie als einen der größten bezeichnet - EleutherAI, eine gemeinnützige Organisation, hat laut eigenen Angaben einen der größten Datensätze lizenzierter und offener Texte für die Ausbildung von KI-Modellen veröffentlicht.
techmeme.com
AI research nonprofit EleutherAI releases the Common Pile v0.1, an 8TB dataset of licensed and open-domain text for AI models that it says is one of the largest (Kyle Wiggers/TechCrunch)
Create attached notes ...
