За пределами спекуляций: Как детерминированные ЦП доставляют предсказуемую производительность ИИ

Современные процессоры используют спекулятивное выполнение для улучшения производительности, но это вводит уязвимости и расточает энергию. Новый детерминированный, основанный на времени, модель выполнения предлагает альтернативу, присваивая каждой инструкции точный слот выполнения. Этот подход использует счетчик времени для планирования инструкций на основе зависимостей и доступности ресурсов. Он исключает предположения и заменяет их предсказуемым потоком выполнения, который бросает вызов существующим спекулятивным подходам. Архитектура расширяется до матричных вычислений и демонстрирует масштабируемость, сопоставимую с Google's TPUs, при более низких затратах. Этот метод признает задержку, но заполняет ее полезной работой, избегая откатов и спекулятивных сравнителей. Спекуляция увеличивает непредсказуемость и неэффективность питания, особенно с рабочими нагрузками ИИ и МО, что приводит к провалам производительности и уязвимостям безопасности. Эта модель выполнения, основанная на времени, использует векторный сопроцессор с 12 стадиями конвейера и возможностью декодирования в 8 раз. Счетчик времени и таблица результатов регистров детерминированно планируют инструкции, отслеживая готовность операндов и информацию о опасностях, что снижает количество неиспользуемых слотов выпуска. Система прогнозирует окна задержки для операций с памятью, планируя независимые инструкции для высокой загрузки, и упрощает аппаратуру, снижает потребление энергии и избегает сброса конвейера.

t.me

AI и ML Дайджест в Телеграмм канале @ai_ml_news_ru

venturebeat.com

Moving past speculation: How deterministic CPUs deliver predictable AI performance

RSS Hunter

2025-11-02

Create attached notes ...