Cloudflare 最近宣布推出新的基础设施,旨在在其全球网络中运行大型 AI 语言模型。由于这些模型依赖昂贵的硬件,且需处理大量入站和出站文本,Cloudflare 将模型的输入处理与输出生成分离到不同的优化系统上。作者:Renato Losio
infoq.com
Cloudflare Builds High-Performance Infrastructure for Running LLMs
Create attached notes ...
