加速端侧 AI:Arm 与 Google AI Edge 优... 笔记

加速端侧 AI:Arm 与 Google AI Edge 优化探析

Arm 可扩展矩阵扩展 2(SME2)与 Google AI Edge 软件栈的集成,通过将 CPU 转化为强大的矩阵计算加速器,实现了高性能的端侧生成式 AI。以 Stability AI 的"stable-audio-open-small"模型为例,文章概述了一条简化的“转换、优化与部署”流水线,该流水线利用 LiteRT、XNNPACK 和 KleidiAI 实现硬件加速的自动化。最终实现方案在 Arm 驱动的移动设备和笔记本电脑上,在保持高音频质量的同时,将音频生成速度提升超过 2 倍,并将内存使用量降低 4 倍。