VentureBeat 的 RSS 订阅

FOMO 是企业购买闲置 GPU 的原因,也是价格持续上涨的根源。

Follow
企业正经历严重的 GPU 利用率不足问题,平均利用率约为 5%,这一现象源于一个复杂的恶性循环。GPU 供应稀缺推高了价格,使得团队不愿释放闲置容量,担心无法重新获取。这种“错失恐惧症”(FOMO)导致过度配置和按小时计费,进一步强化了低利用率的循环。文章指出,该问题既源于采购效率低下,也源于架构缺陷。采购实践中,企业往往签订长期合同,采购远超实际需求的 GPU,加剧了这一问题。而在容器化 AI 工作负载的架构层面,GPU 闲置现象同样突出;企业常在容器内请求过量的资源,进一步加剧浪费。提升利用率需要采用 GPU 共享和时间切片等技术,但这些做法尚未普及。AWS 上调预留 GPU 价格的决定表明,供应短缺是真实存在的。云市场已分化为“通用层”和“前沿层”:前者价格下降,后者因短缺而价格上涨。文章建议采取多管齐下的策略,包括持续的资源规格调整、跨区域抢占式实例部署以及承诺资源的重新平衡。企业最应思考的关键问题是:H200 是否真的必要,还是存在更经济的替代方案。
favicon
venturebeat.com
FOMO is why enterprises pay for GPUs they don't use — and why prices keep climbing
Create attached notes ...