Локальный приоритет и полная прослеживаемость: маршрутизация между Ollama, Foundry Local и Microsoft Foundry
Публикация проектов агентов связана с противоречием между мощными облачными возможностями ИИ и ограниченным терпением пользователей, которые пробуют проект всего несколько минут. Для решения этой проблемы гибридный подход направляет запросы к различным уровням моделей в зависимости от их доступности, в рамках единого контракта. Это гарантирует, что даже если облачные сервисы выйдут из строя, будет использоваться локальная резервная копия с той же схемой и путем выполнения кода. Возможность форка, или способность запустить проект на машине другого пользователя, становится надежной благодаря этому подходу. Наблюдаемость, обеспечиваемая подробным логированием и трассировкой, укрепляет доверие пользователей, делая очевидным, какой путь обслуживал каждый запрос и почему.Система отдает приоритет локальным моделям, но может беспрепятственно переключаться на облачные модели Foundry, если локальные варианты недоступны или сталкиваются с ошибками. Эта отказоустойчивость управляется автоматически в функциях, таких как create_chat_completion, которая обрабатывает несколько сценариев сбоя без необходимости вмешательства вызывающей стороны. Когда происходит откат, он явно регистрируется и отображается в журнале воспроизведения, предоставляя прозрачную запись процесса. Система позволяет осуществлять маршрутизацию по ролям, давая возможность различным агентам в системе использовать конкретные модели, будь то облачные или локальные. Конфигурация во время выполнения может быть изменена через консоль настроек, позволяя вносить изменения в режимы маршрутизации и назначения моделей без перезапуска приложения. Тайм-ауты и повторные попытки строго ограничены, чтобы предотвратить зависание системы, обеспечивая пользователям быстрый и информативный опыт обработки ошибок.
create_chat_completion, которая обрабатывает несколько сценариев сбоя без необходимости вмешательства вызывающей стороны. Когда происходит откат, он явно регистрируется и отображается в журнале воспроизведения, предоставляя прозрачную запись процесса. Система позволяет осуществлять маршрутизацию по ролям, давая возможность различным агентам в системе использовать конкретные модели, будь то облачные или локальные. Конфигурация во время выполнения может быть изменена через консоль настроек, позволяя вносить изменения в режимы маршрутизации и назначения моделей без перезапуска приложения. Тайм-ауты и повторные попытки строго ограничены, чтобы предотвратить зависание системы, обеспечивая пользователям быстрый и информативный опыт обработки ошибок.