RSS Блог о машинном обучении A... Заметка

RSS Блог о машинном обучении AWS

Указанный URL-адрес относится к блогу Amazon Web Services (AWS) Machine Learning Blog. В этом разделе сайта AWS публикуются статьи и обновления, посвященные технологиям машинного обучения, их использованию в AWS, а также реальным приложениям и случаям применения машинного обучения. Эти блоги призваны помочь разработчикам, ученым и инженерам понять, как использовать машинное обучение для решения различных задач, таких как предиктивная аналитика, обработка естественного языка, компьютерное зрение и другие. В разделе блогов также обсуждаются новые и возникающие тенденции в области машинного обучения и способы их интеграции с сервисами AWS.

Трэд заметок

Amazon SageMaker AI Async Inference теперь поддерживает запросы с встроенными данными

Сегодня мы объявляем о поддержке полезной нагрузки встроенного типа для Amazon SageMaker AI Async Inference. Теперь клиенты могут отправлять полезные нагрузки вывода напрямую в теле запроса API InvokeEndpointAsync, что исключает необходимость загружать входные данные в Amazon Simple Storage Service (Amazon S3) перед каждым вызовом.

Верните себе часы каждый день с помощью автономных агентов в Amazon Quick

Сегодня Quick становится ещё более мощным: новые автономные агенты, которые непрерывно работают от вашего имени, лента активности, которая помогает вам расставлять приоритеты в вашей наиболее важной работе, и возможность находить информацию по всем источникам данных, на которых работает ваш бизнес, по одному вопросу.

Контекстный интеллект для ваших данных и агентов ИИ в крупном масштабе

Агенты умны только в той степени, в которой они могут рассуждать в определённом контексте. Сегодня этот контекст разбросан по озёрам данных, хранилищам данных, lakehouse, базам данных и потокам, а также по знаниям учреждений, которые никогда не были записаны. Вы хотите доверять решениям, принимаемым вашими агентами ИИ, но это невозможно, пока у агентов нет контекста. Представьте, что станет возможным, когда мы дадим агентам безопасный способ получить доступ к контексту, необходимому для принятия достоверных решений. Именно поэтому на саммите AWS в Нью-Йорке мы объявляем о серии инноваций, которые обеспечивают интеллект для ваших данных и агентов ИИ в крупном масштабе.

Новое в Amazon Bedrock AgentCore: Создание агентов с более широкими знаниями и непрерывным обучением

Сегодня мы представляем новые возможности на платформе Amazon Bedrock AgentCore, предназначенной для создания, подключения и оптимизации агентов. В этом посте мы расскажем, как эти возможности устраняют пробелы: подключая агентов к организационным, веб- и платным знаниям; помогая командам находить и исправлять ошибки в производстве; и обеспечивая масштабируемый контроль при росте возможностей агентов. Вместе они помогают вам создавать более совершенных агентов быстрее, управлять ими с помощью масштабируемых контролей и непрерывно совершенствовать их.
CdXz5zHNQW_QyFj6ifCjy.png

Защитите свои приложения агентного ИИ с помощью Amazon Bedrock Guardrails InvokeGuardrailChecks API

Сегодня мы объявляем о новом API с Amazon Bedrock Guardrails. С помощью этого API вы можете применять отдельные меры безопасности, также называемые проверками безопасности, в любой точке ваших агентных приложений ИИ без создания ресурсов ограждений. В этом посте мы расскажем, как работает API InvokeGuardrailChecks и как использовать его для построения безопасных, многоходовых агентных приложений ИИ.
CdXz5zHNQW_i2rrGSHwhG.png

Представляем кэширование контейнеров в Amazon SageMaker AI для более быстрого масштабирования моделей

Сегодня мы рады объявить о кэшировании контейнерных изображений для вывода ИИ Amazon SageMaker, следующем крупном этапе в нашем пути оптимизации быстрого масштабирования. Это ускоряет конечную задержку до 2 раз для генеративных моделей ИИ во время событий горизонтального масштабирования.
CdXz5zHNQW_hsyyUSX0at.png

Параллелизация спекулятивного декодирования с P-EAGLE в Amazon SageMaker AI

Этот пост расскажет вам, как использовать P-EAGLE напрямую в Amazon SageMaker AI. Он продемонстрирует, как выбрать совместимую модель из каталога SageMaker JumpStart, настроить спецификации параллельного проектирования и развернуть высокооптимизированную реальную точку окончания SageMaker AI для ускорения ваших приложений генеративного ИИ.
CdXz5zHNQW_UFPtYiK9fA.jpeg

Представляем модели Gemma 4 на Amazon Bedrock

Сегодня мы объявляем о доступности семейства Gemma 4 на Amazon Bedrock. Разработанное компанией Google DeepMind и выпущенное под лицензией Apache 2.0, Gemma 4 представляет собой семейство моделей с открытыми весами, разработанных с учетом интеллекта на параметр в широком диапазоне сценариев развертывания. Семейство включает в себя три варианта, настроенных на инструкции: Gemma 4 31B, Gemma 4 26B-A4B и Gemma 4 E2B. Они охватывают плотные и архитектуры mixture-of-experts (MoE), где только доля параметров модели активируется на каждый запрос. Варианты предлагают встроенную логическую обработку, родную функциональную вызов и многомодальный ввод по тексту и изображению.

Обнаружение неисправностей агентов ИИ и анализ коренной причины с помощью Strands Evals

В этом посте мы проведем вас через вызов функций обнаружения для диагностики реальных сбоев агентов. Вы узнаете, как интерпретировать их структурированный вывод: категоризированные сбои с оценками достоверности, причинно-следственные цепочки, связывающие коренные причины с симптомами, и рекомендации по исправлению, указывающие, относится ли изменение к вашему системному запросу или определениям инструментов. Вы также узнаете, как интегрировать обнаружение в вашу оценочную трубу для автоматической диагностики при каждом запуске теста.
CdXz5zHNQW_zY4s5o3hIt.png

Создавайте контекстно-богатых исследовательских агентов с помощью Deep Agents и Bedrock AgentCore

В этом посте вы создадите агент исследования конкурентов, который демонстрирует этот шаблон от начала до конца. Этот обзор предназначен для разработчиков, создающих многоступенчатые рабочие процессы ИИ, которым требуются изолированные среды выполнения для своих агентов. В части 2 заметки вы можете развернуть этот же агент в среде выполнения Bedrock AgentCore Runtime с помощью интерфейса командной строки AgentCore, чтобы он работал как управляемая, изолированная от сеанса служба.
CdXz5zHNQW_1oUW8HUA2M.png

Создание Суперзарядки: Как Rocket Close оптимизировал операции с заголовками с помощью агентного ИИ

В этом посте мы исследуем, как Rocket Close построила решение, используя Strands Agents, большие языковые модели (LLM), Amazon Bedrock, базы знаний Amazon Bedrock и инструменты протокола контекста модели (MCP). Мы рассматриваем функции решения, обоснование технологического стека, уроки, извлеченные из опыта, и бизнес-воздействие на Rocket Close.
CdXz5zHNQW_LrC3ZbmSJM.png

Создайте помощника для подготовки и последующей обработки встреч с помощью серверов Amazon Quick и Cisco Webex MCP

Этот пост показывает, как создать индивидуального помощника для подготовки и последующего сопровождения встречи с использованием серверов Amazon Quick и Cisco Webex MCP. Из одного запроса агент находит предстоящую встречу Webex, просматривает предыдущие сводки встреч и транскрипты, и извлекает связанные с этим выдержки из видеокастов и контекст транскрипта. Затем он ищет в потоках сообщений Webex незавершенные последующие действия и создает краткий подготовительный бриф. После встречи тот же помощник может суммировать обсуждение и выявить пункты для действий. Он также может найти связанные обновления видеокастов и составить сообщение для последующего сопровождения в подходящем пространстве Webex.
CdXz5zHNQW_fnFiuuxGXr.png

От PDF до прозрений: Архитектура интеллектуальной обработки документов с помощью сервисов AWS генеративного ИИ

Этот пост описывает разработку эффективной и масштабируемой системы интеллектуальной обработки документов на платформе AWS, работающей на базе Amazon Bedrock и ее функций. BDA - это управляемая служба в Amazon Bedrock, которая автоматизирует извлечение информации из документов. Мы демонстрируем, как BDA извлекает и анализирует содержимое документов, а Strands Agent, размещенный на Amazon Bedrock AgentCore Runtime, координирует специализированные задачи обработки, а база знаний Amazon Bedrock обеспечивает контекстное понимание на основе нескольких документов. Объединив эти возможности в единой архитектуре, организации могут преобразовать свои рабочие процессы обработки документов с минимальными затратами на разработку.
CdXz5zHNQW_peglu7dJbE.png

Построено изнутри наружу: Как AWS Professional Services стала командой-пионером

Профессиональные услуги Amazon Web Services (AWS ProServe) сократили сроки участия с месяцев до дней, не добавляя инструменты искусственного интеллекта (ИИ) к существующему процессу, а фундаментально перестраивая, как мы доставляем снутри наружу. В этом посте мы делаем доступным, как AWS ProServe стал командой фронтира, практики, которые это позволили, и что ваша инженерная организация может взять из нашего опыта.
CdXz5zHNQW_sdUF0T9PNf.png

Извлекайте данные с помощью динамических конвейеров по запросу и пакетных конвейеров

Этот пост демонстрирует интеллектуальный конвейер обработки документов, который состоит из опций как пакетного, так и интерактивного вывода на Amazon Bedrock, чтобы обеспечить гибкость во времени и стоимости обработки документов.
CdXz5zHNQW_XrAKCcZnY1.png

Систематически оценивайте ИИ-агентов с помощью Agent-EvalKit

Agent-EvalKit — это набор инструментов с открытым исходным кодом (Apache 2.0), который делает эту инфраструктуру оценки доступной путем интеграции с ИИ-помощниками для написания кода, включая Claude Code, Kiro CLI и Kilo Code. В этой статье подробно рассматривается, как Agent-EvalKit работает на всех шести этапах оценки, используя в качестве примера агент для исследования путешествий, созданный с помощью Strands Agents SDK и Amazon Bedrock.
CdXz5zHNQW_dcCuBEtw7C.png

Быстрее выявляйте тенденции, умнее сортируйте: раскрывая возможности Sparklines и пользовательской сортировки в Amazon Quick

Сегодня мы рады объявить о двух новых возможностях, которые делают дашборды Quick Sight еще более выразительными и соответствующими бизнес-целям: спарклайны и пользовательская сортировка для элементов управления. В этой статье мы подробно рассмотрим обе функции, что они собой представляют, когда их использовать и как их настроить, с реальными сценариями, которые объединяют их в практичный, готовый к принятию решений дашборд.
CdXz5zHNQW_mwSbD3WsXY.jpeg

Оптимизация точности извлечения чертежей в Amazon Bedrock Data Automation

Оптимизация инструкций чертежа — это функция BDA, которая автоматически улучшает ваши инструкции по извлечению для прямого решения этой проблемы. Вы предоставляете от трех до десяти примеров документов с ожидаемыми значениями, и BDA улучшает ваши инструкции чертежа для повышения точности за минуты, а не недели. Отдельная донастройка модели не требуется. К концу этой статьи вы сможете оптимизировать свои чертежи для повышения точности, запустить рабочий процесс оптимизации через консоль Amazon Bedrock или API, а также применить лучшие практики для выбора примеров и эталонных данных.
CdXz5zHNQW_xJtxMVhvUr.png

Как команды фронтира переосмысливают разработку с использованием искусственного интеллекта

Команды на переднем крае не просто используют ИИ для более быстрого кодирования. Они перерабатывают процесс создания программного обеспечения. В результате получается увеличение производительности в 4,5 раза, в некоторых случаях более чем в 10 раз.
CdXz5zHNQW_2lVGI3IYn0.png

Остановите ручную настройку ядер: Как Neuron Agentic Development ускоряет оптимизацию AWS Trainium

Сегодня мы объявляем о возможностях разработки Neuron Agentic: коллекции агентов ИИ и навыков, которые делают это возможным для разработчиков, работающих с AWS Trainium и AWS Inferentia. В этом посте мы объясняем, как возможности разработки Neuron Agentic ускоряют рабочий процесс разработки ядра.
CdXz5zHNQW_lzsvjzjpDd.png

Создайте помощника по ремонту оборудования на основе ИИ, используя Amazon Bedrock AgentCore

В этом посте вы создаете помощника по ремонту оборудования на основе ИИ, используя Amazon Bedrock AgentCore, который помогает фермерам и техникам на местах диагностировать проблемы с оборудованием, определять необходимые запчасти и получать доступ к процедурам ремонта, одобренным производителем, через естественный язык. Решение использует AgentCore Runtime с набором инструментов Strands Agents SDK, Amazon Nova 2 Lite в качестве базовой модели, базу знаний Amazon Bedrock для генерации с поддержкой извлечения (RAG) и AgentCore Memory для сохранения разговора.
CdXz5zHNQW_Elx4ZOLlbW.png

Масштабируйте обучение роботов с помощью подкрепления с помощью NVIDIA Isaac Lab на Amazon SageMaker AI

В этом посте мы показываем, как обучать политики робота для гуманоида Unitree H1 с помощью NVIDIA Isaac Lab на Amazon SageMaker AI на двух вариантах вычислений: Amazon SageMaker HyperPod и Amazon SageMaker Training Jobs.
CdXz5zHNQW_PPYtY1kXNX.png

Ручное уведомление о первом уведомлении о потере: Использование агентов Strands и инструмента Amazon Bedrock AgentCore Browser для интеллектуального приема претензий

В этом посте мы демонстрируем, как система приема заявок FNOL без участия рук объединяет агентов, созданных с помощью набора инструментов Strands Agents SDK для рассуждений в области, с инструментом Amazon Bedrock AgentCore Browser для взаимодействия с живым порталом. Этот подход сохраняет человеческий опыт, удаляя при этом повторяющуюся работу на экране.
CdXz5zHNQW_KWCJXGCmIL.png

Создайте помощник по расшифровке инцидентов с помощью Amazon Quick и New Relic

Этот пост показывает командам инженеров, как применить этот принцип к одному из наиболее критичных по времени рабочих процессов в инженерии: выявлению инцидентов. Вы создадите индивидуального помощника для выявления инцидентов с помощью Amazon Quick, который организует ответ с сервером New Relic Model Context Protocol (MCP) и Asana через родные интеграции. Из одного запроса агент Amazon Quick расследует инцидент, собирает краткое изложение анализа коренной причины (RCA) с ссылками на доказательства и создает отслеживаемую задачу Asana, готовую к передаче.
CdXz5zHNQW_rtLjSHmh5n.png

Разблокировка гибкости ИИ в Европе: Руководство по межрегиональному выводу для обработки данных ЕС и доступа к моделям

С учетом доступа к последним моделям генеративного ИИ и высокопроизводительным ускоренным вычислениям, которые пользуются высоким спросом во всем мире, клиентам AWS необходимы инструменты, чтобы воспользоваться доступностью и емкостью моделей в нескольких регионах AWS, одновременно соблюдая требования безопасности и конфиденциальности. Обработка вывода в нескольких регионах (CRIS) в Amazon Bedrock удовлетворяет этим потребностям, автоматически маршрутизируя запросы в нескольких регионах [...]
CdXz5zHNQW_pZ99OAWaEx.png

Теперь можно закрыть ноутбук: размещение кодирующих агентов на Amazon Bedrock AgentCore

Amazon Bedrock AgentCore Runtime предоставляет каждой сессии агента свою изолированную микровиртуальную машину с постоянным рабочим пространством, безопасным доступом к инструментам через шлюз и встроенной наблюдаемостью — так что вы можете запускать Claude Code, Codex, Kiro и Cursor параллельно без обмена секретами, портами или файловыми системами. Закройте крышку, идите ужинать и продолжайте работу с того места, где остановились, завтра.
CdXz5zHNQW_uKokJHCyNJ.png

Лучшие решения в масштабе: Как математическая оптимизация помогает там, где интуиция терпит неудачу

В этой статье мы знакомим с математической оптимизацией, объясняем, как она вписывается в более широкий ландшафт ИИ, и демонстрируем реальные истории успеха, где Центр инноваций сотрудничал с клиентами для достижения конкретных результатов.
CdXz5zHNQW_g4vfM0Uk1D.png

Конечное шифрование вывода машинного обучения с Amazon SageMaker AI и гомоморфным шифрованием

Этот блог ранее обсуждал FHE для вывода ML в посте Включите полностью гомоморфное шифрование с помощью конечных точек Amazon SageMaker для безопасного вывода в реальном времени, но этот пост идет немного дальше. Предыдущий пост показал, как реализовать вывод на основе FHE «с нуля» путем создания алгоритма линейной регрессии с использованием низкоуровневой библиотеки под названием SEAL. Вместо этого этот пост демонстрирует гораздо более гибкий и высокоуровневый подход на основе concrete-ml, высокоуровневой библиотеки, специально разработанной для вывода на основе FHE. Она поддерживает несколько общих типов моделей «из коробки» и даже совместима с API известной библиотеки ML scikit-learn.
CdXz5zHNQW_lZRyRwHx6Y.png

Amazon Quick ARNs: Перемещение между учетными записями и разрешения пространства имен

В этой статье мы рассматриваем структуру Amazon Quick ARN и предоставляем практическую умственную модель для работы с ними. К концу статьи вы сможете посмотреть на ARN и сразу понять, что он значит для вашей стратегии миграции, быстрее диагностировать проблемы с разрешениями и проектировать многопользовательские архитектуры с уверенностью.
CdXz5zHNQW_KplENPUqkB.png

Оцените вашего голосового агента Amazon Nova Sonic в масштабе, без необходимости микрофона

В этом посте мы расскажем вам о Nova Sonic Test Harness, открытом фреймворке, который мы разработали для решения обеих проблем. Он служит инструментом быстрой итерации для настройки системных подсказок и конфигураций инструментов (запустите разговор, посмотрите результаты, отрегулируйте, повторите) и комплексной оценочной основой для проверки качества голосовых агентов в масштабе. Он автоматически запускает полные разговоры с несколькими ходами с Amazon Nova Sonic, оценивает их с помощью методов LLM-as-judge и даже может обнаруживать случаи, когда аудиовыход модели не соответствует ее текстовому выходу (аудио-галуцинации). Микрофон не требуется.
CdXz5zHNQW_EhsiRQ8N28.png

NVIDIA Nemotron 3 Ultra теперь доступен на Amazon SageMaker JumpStart

Разверните NVIDIA Nemotron 3 Ultra в Amazon SageMaker JumpStart. Получите ускорение вывода в 5 раз и снижение стоимости на 30% для агентных рабочих нагрузок ИИ с этой передовой моделью рассуждений.
CdXz5zHNQW_Ev31nty21R.png

Как создать автономные операции ИИ на Amazon Bedrock в крупном масштабе

В этом посте мы представляем Amazon Bedrock Ops Alert, трехслойное автоматизированное решение для мониторинга, которое проактивно обнаруживает операционные проблемы, динамически корректирует пороги сигнализации, классифицирует сигнализацию по категориям, автоматически создает контекстно-зависимые запросы на поддержку, помогает предотвратить дублирование запросов, когда уже активен неразрешенный запрос той же категории сигнализации, и доставляет контекстуализированные уведомления командам AI SRE. Мы рассматриваем архитектуру решения и то, как вы можете развернуть его в своей собственной среде.
CdXz5zHNQW_3u78FaUwyr.png

Большая табличная модель NEXUS от Fundamental теперь доступна на Amazon SageMaker JumpStart

В этом посте мы показываем вам, как начать работать с NEXUS на Amazon SageMaker JumpStart, пройдемся по процессу развертывания и продемонстрируем, как запускать прогнозы на основе наборов данных вашего предприятия.
CdXz5zHNQW_fzTkSdXpUu.png

Сокращение времени холодного запуска контейнеров с помощью индекса SOCI на DLAMI и DLC

В этой статье мы рассматриваем, как использовать SOCI на публично доступных образах и контейнерах Deep Learning, когда использовать различные режимы SOCI, предоставляемые инструментом, и как быстро и эффективно использовать этот инструмент в ваших рабочих процессах сегодня.
CdXz5zHNQW_akK9rYwhB3.jpeg

Улучшите точность вызова инструментов вашего агента с помощью SFT и DPO в Amazon SageMaker AI

В этом посте вы узнаете, как использовать контролируемое тонкое настройка (SFT) и прямую оптимизацию предпочтений (DPO) вместе для улучшения точности вызова инструментов небольшой языковой модели (SLM). Пример использует задания обучения Amazon SageMaker AI, поэтому вы можете сосредоточиться на коде обучения, вместо управления собственной инфраструктурой обучения. Вы также узнаете, как оценить точность вызова инструментов и сравнить базовую модель с несколькими вариантами тонкой настройки, чтобы принимать обоснованные решения о качестве модели.
CdXz5zHNQW_5QDwass9I8.png

Искусство и наука оптимизации гиперпараметров на Amazon Nova Forge

Настройка для задач конкретной области означает улучшение производительности в одной области без ухудшения общих возможностей модели, и достижение этого баланса сложнее, чем кажется. Этот пост описывает, как найти этот баланс, начиная с выбора правильной стратегии настройки для ваших данных и задачи, и заканчивая настройкой параметров обучения, которые наиболее влияют на результаты, таких как скорость обучения, размер партии и сохранение контрольных точек. Мы также рассматриваем распространенные ошибки, которые приводят к бесполезным запускам обучения и как их обнаружить на ранней стадии, чтобы вы могли улучшить производительность в конкретной области без ухудшения общих возможностей или траты вычислительных ресурсов на избегаемые неудачи. К концу вы узнаете, как улучшить производительность в конкретной области без ухудшения общих возможностей и как избежать дорогостоящих неудач, которые возникают из-за неправильного баланса.
CdXz5zHNQW_6gZKeRry2j.png

Обнаружение объектов с Amazon Nova 2 Lite

В этом посте мы расскажем об реализации обнаружения объектов с помощью Amazon Nova 2 Lite. Вы узнаете, как развернуть приложение для обнаружения объектов, используя Amazon Bedrock, AWS Lambda и Amazon API Gateway. Кроме того, вы узнаете, как создавать эффективные подсказки, обрабатывать структурированный вывод JSON и визуализировать результаты. Мы исследуем практические применения в производстве, сельском хозяйстве и логистике.
CdXz5zHNQW_b6d569sZfw.png

Как Baz улучшил точность проверки кода ИИ-агента с помощью Amazon Bedrock AgentCore

Этот пост описывает, как компания Baz создала своего агента Spec Review с помощью Amazon Bedrock и Amazon Bedrock AgentCore. Мы рассмотрим архитектурные решения, детали реализации и бизнес-результаты, которых они достигли, используя эти сервисы AWS для автоматизации процесса проверки кода
CdXz5zHNQW_XEQZXdOF8l.jpeg

Настройка безопасного потока аутентификационного кода с помощью шлюза AgentCore Gateway с клиентами MCP

Этот пост демонстрирует, как реализовать поток кода Open Authorization (OAuth) в качестве входного механизма авторизации для серверов MCP, размещенных на шлюзе Amazon Bedrock AgentCore. К концу этого руководства у вас будет готовый к производству вариант, в котором каждый запрос помощника ИИ будет аутентифицирован с помощью действительного токена идентификации пользователя, выданного поставщиком идентификации вашей организации.
CdXz5zHNQW_MicsMBiXMo.jpeg

Ссылайтесь на свои собственные секреты AWS Secrets Manager в Amazon Bedrock AgentCore Identity

Сегодня мы рады объявить о возможности ссылаться на секрет в AWS Secrets Manager для AgentCore Identity, чтобы вы могли ссылаться на свой предварительно настроенный секрет из Secrets Manager и сохранять полный контроль над его управлением. С этой возможностью вы можете расширить существующие процессы управления секретами вашей организации до AgentCore. Вы можете предоставить существующий, предварительно настроенный секрет AWS Secrets Manager для использования с ресурсами ваших провайдеров учетных данных. Вы сохраняете полный контроль над его конфигурацией шифрования, ротацией, репликацией, тегами и политиками ресурсов, как и управляете другими секретами в Secrets Manager. Вы также можете выбрать секрет из другого учетной записи AWS в том же регионе AWS, хотя обмен секретами между регионами не поддерживается. Это также поддерживает секреты, импортированные через внешние соединители AWS Secrets Manager, что позволяет интегрироваться с внешними менеджерами секретов.
CdXz5zHNQW_zNtYoCtI6A.png

Трансформация исследований редких видов рака с помощью Amazon Quick: Интеграция биомедицинских баз данных для прорывных открытий

В этом посте мы расскажем, как использовать Amazon Quick Research для интеграции источников биомедицинских данных для исследования редких видов рака. Обзор использует педиатрический сарком как область исследования и опирается на публично доступные наборы данных из PubMed и других открытых биомедицинских репозиториев. Он охватывает рабочий процесс от начала до конца: определение цели исследования, настройку источников данных, просмотр плана исследования, сгенерированного ИИ, проведение расследования и итерацию результатов с помощью системы пересмотра и версионирования.
CdXz5zHNQW_JZ57P7YW9R.jpeg

Модели OpenAI и Codex на Amazon Bedrock теперь общедоступны

GPT-5.5, GPT-5.4 и Codex теперь в общем доступе на Amazon Bedrock. Разверните их в производственных приложениях и агентах сегодня, на высокопроизводительном движке вывода Bedrock.
CdXz5zHNQW_Uy9DUyp4kL.png

Расширение поддержки MCP для Amazon Bedrock AgentCore Gateway

При развертывании серверов протокола контекста модели (MCP) в производстве предприятиям необходим тонкий контроль доступа между серверами, наблюдаемость за тем, какие команды используют какие инструменты, гарантии безопасности против утечки данных и централизованное управление учетными данными, все это в масштабе. Amazon Bedrock AgentCore Gateway располагается между серверами MCP и клиентами, которые их используют, централизуя управление учетными данными, наблюдаемость и безопасность [...]
CdXz5zHNQW_0n3Vui2fh6.png

Защищенные агенты ИИ с помощью перехватчиков Policy и Lambda в шлюзе Amazon Bedrock AgentCore

В этом посте мы используем агент данных lakehouse, чтобы продемонстрировать, как можно использовать Policy для детерминированного контроля доступа и перехватчики Lambda для динамической валидации. Затем мы показываем, как можно объединить перехватчики Lambda и Policy для реализации географически-ориентированного контроля доступа, который требует как динамической валидации, так и детерминированного контроля доступа.
CdXz5zHNQW_DEhVNEvCYo.png

Включите безопасные агентские платежи с встроенными ограничителями, используя Amazon Bedrock AgentCore платежи

В этом посте мы рассматриваем несколько ключевых рисков, которые возникают при проектировании агентской системы оплаты, и то, как их можно устранить с помощью возможностей платежей AgentCore.
CdXz5zHNQW_heIs5lPyL5.png

AgentOps: Операционализация агентного ИИ в масштабе с Amazon Bedrock AgentCore

Когда вы создаете решения на основе агентского ИИ, вы сталкиваетесь с уникальными операционными проблемами. Агенты принимают непредсказуемые решения, затраты неожиданно увеличиваются, а отладка недетерминированных сбоев кажется невозможной. Приложения агентского ИИ не просто выполняют предопределенные рабочие процессы. Они рассуждают, адаптируются и принимают автономные решения, и практики DevOps необходимо адаптировать. Именно здесь на сцену выходит AgentOps, операционная дисциплина для развертывания, управления и непрерывного совершенствования ИИ-агентов в производстве.
CdXz5zHNQW_8EEvCn1mbX.jpeg

Ускорьте загрузку модели LLM и увеличьте контекстные окна с помощью GPUDirect на Amazon FSx для Lustre и TurboQuant

Если вы занимаетесь развертыванием больших языковых моделей (LLM) на экземплярах AWS GPU, вы, вероятно, заметили, что чем больше модель, которую необходимо загрузить в память GPU с высокой пропускной способностью (HBM), тем дольше болезненный ожидание до тех пор, пока GPU не будут готовы для вывода. По мере роста моделей до сотен миллиардов параметров и роста среды GPU, всё больше и больше […]
CdXz5zHNQW_9dUbI7TMgW.png

Amazon Быстрая интеграция с базами данных временных рядов для рыночной разведки с помощью MCP

В этой статье мы рассмотрим практическую реализацию интеграции сервера KDB-X MCP с Amazon Quick, демонстрируя, как трейдеры и аналитики могут задавать вопросы на естественном языке и получать действенные сведения из наборов данных. Вы можете применить этот же шаблон интеграции в различных областях, от анализа финансовых рынков до мониторинга датчиков IoT и панелей мониторинга производительности DevOps, где вам необходимо упростить доступ к аналитике временных рядов.
CdXz5zHNQW_bwWPbv6dOf.jpeg

Комплексная наблюдаемость для вывода Amazon SageMaker AI LLM: от использования GPU до качества LLM

Этот пост демонстрирует комплексное решение для наблюдаемости с помощью панелей Amazon Managed Grafana, которое обеспечивает целостный вид как качества, так и количества для БМЯ, обслуживаемых на конечных точках ИИ Amazon SageMaker с компонентами вывода.
CdXz5zHNQW_aDQHc0cILz.png

Обучение азербайджанских языковых моделей на Amazon SageMaker AI

ООО Azercell Telecom, ведущий поставщик телекоммуникационных услуг Азербайджана, хотел создать большую языковую модель (LLM) на азербайджанском языке в Amazon SageMaker AI для телекоммуникационных случаев использования и чат-бота, взаимодействующего с клиентами. Вызов заключался в адаптации базовых моделей (FMs) к языку с богатой морфологией и ограниченными данными для обучения, а также отсутствием готового плана для эффективного обучения LLM на азербайджанском языке. В рамках шестинедельного сотрудничества Azercell работал с Центром инноваций генеративного ИИ AWS, чтобы создать готовую к производству основу на Amazon SageMaker AI.
CdXz5zHNQW_Xlbsxkeqf3.png