Современные процессоры используют спекулятивное выполнение для улучшения производительности, но это вводит уязвимости и расточает энергию. Новый детерминированный, основанный на времени, модель выполнения предлагает альтернативу, присваивая каждой инструкции точный слот выполнения. Этот подход использует счетчик времени для планирования инструкций на основе зависимостей и доступности ресурсов. Он исключает предположения и заменяет их предсказуемым потоком выполнения, который бросает вызов существующим спекулятивным подходам. Архитектура расширяется до матричных вычислений и демонстрирует масштабируемость, сопоставимую с Google's TPUs, при более низких затратах. Этот метод признает задержку, но заполняет ее полезной работой, избегая откатов и спекулятивных сравнителей. Спекуляция увеличивает непредсказуемость и неэффективность питания, особенно с рабочими нагрузками ИИ и МО, что приводит к провалам производительности и уязвимостям безопасности. Эта модель выполнения, основанная на времени, использует векторный сопроцессор с 12 стадиями конвейера и возможностью декодирования в 8 раз. Счетчик времени и таблица результатов регистров детерминированно планируют инструкции, отслеживая готовность операндов и информацию о опасностях, что снижает количество неиспользуемых слотов выпуска. Система прогнозирует окна задержки для операций с памятью, планируя независимые инструкции для высокой загрузки, и упрощает аппаратуру, снижает потребление энергии и избегает сброса конвейера.
t.me
AI и ML Дайджест в Телеграмм канале @ai_ml_news_ru
venturebeat.com
Moving past speculation: How deterministic CPUs deliver predictable AI performance
Create attached notes ...
