「Kyle Wiggers / TechCrunch:
AI 研究非営利団体 EleutherAI が、AI モデル向けのライセンス済み・オープンドメインテキストの巨大なコレクション「Common Pile v0.1」をリリースしたと発表しました。これは 8TB のデータセットであり、同団体はこれを最大級のものであると主張しています。」
techmeme.com
AI research nonprofit EleutherAI releases the Common Pile v0.1, an 8TB dataset of licensed and open-domain text for AI models that it says is one of the largest (Kyle Wiggers/TechCrunch)
Create attached notes ...
