Развитие агентного ИИ, который может думать, планировать и действовать автономно в режиме реального времени, изменило компьютерный ландшафт. Агентные модели ИИ могут работать вместе для решения проблем, требуя новой вычислительной платформы со сверхнизкой задержкой обработки данных, рассуждениями с учетом памяти и динамической оркестровкой. Чтобы удовлетворить эти требования, отрасль движется в сторону специализированных кремний, разработанных специально для автономных агентов. Технологические лидеры, такие как Meta, OpenAI и Google, совместно разрабатывают микросхемы, инфраструктуру и уровни оркестрации, чтобы обеспечить первую в мире по-настоящему автономную цифровую рабочую силу. Они инвестируют в суперкомпьютерные системы, технологии охлаждения и оптимизированные для ИИ серверные стойки высокой плотности для управления ресурсами для тысяч одновременных агентов ИИ. Агентный ИИ требует гораздо большей аппаратной специализации для удовлетворения постоянных требований к инференсу, и технологические компании сотрудничают с производителями чипов для создания кремниевых микросхем, предназначенных для инференса с низкой задержкой. Чтобы избежать узких мест в выводе, компании разрабатывают специализированные чипы и нанимают инженеров по совместному проектированию аппаратного и программного обеспечения. Переход от широких вычислений к специализированным микросхемам необходим для поддержки потребностей агентного ИИ, и такие компании, как AMD, выпускают новые графические процессоры, предназначенные для ускорения рабочих нагрузок в области агентного ИИ, генеративного ИИ и высокопроизводительных вычислений. Энергоэффективность в настоящее время является главным приоритетом проектирования, а поставщики инфраструктуры поставляют периферийные чипы ИИ и стойки для центров обработки данных, предназначенные для распределенного познания. Несмотря на растущий импульс, ключевые проблемы сохраняются, в том числе обоснование ценности инициатив в области агентного ИИ и управление непредсказуемыми расходами, связанными с ИИ.
fastcompany.com
Agentic AI is driving a complete rethink of compute infrastructure
Create attached notes ...
