RSS Блог об облаках Заметка

RSS Блог об облаках

cloud.google.com/blog - это официальный блог Google Cloud. В нем публикуются новости, обновления и мнения о продуктах и услугах Google Cloud, а также о тенденциях и инновациях в индустрии облачных вычислений. В блоге публикуются статьи, написанные экспертами, инженерами и идейными вдохновителями Google Cloud, охватывающие широкий спектр тем, таких как искусственный интеллект, машинное обучение, аналитика данных, безопасность и многое другое. Статьи часто содержат технические руководства, тематические исследования и лучшие практики, что делает блог ценным ресурсом для разработчиков, ИТ-специалистов и руководителей компаний, которые используют Google Cloud или интересуются им. Блог хорошо организован, статьи разделены на категории по темам, продуктам и отраслям. Посетители могут просматривать последние статьи, искать конкретные темы или подписаться на RSS-канал блога, чтобы всегда быть в курсе последних новостей и обновлений. Некоторые из ключевых особенностей блога включают: - Подробные статьи о продуктах и сервисах Google Cloud, таких как Google Cloud Platform, Google Cloud Storage и Google Cloud AI Platform. - Технические руководства и инструкции по использованию сервисов Google Cloud - тематические исследования и истории успеха клиентов Google Cloud - Аналитические материалы о тенденциях и инновациях в отрасли - Новости и обновления о партнерствах и сотрудничестве Google Cloud - Интервью с экспертами и идейными вдохновителями Google Cloud В целом, блог Google Cloud - это ценный ресурс для всех, кто интересуется облачными вычислениями, искусственным интеллектом и смежными технологиями.

Трэд заметок

Что нового в агентах данных: Ускорение ваших рабочих процессов с ИИ

Обычные ИИ-агенты часто испытывают трудности с корпоративными данными из-за отсутствия контекстного понимания и проблем с безопасностью. Google Agentic Data Cloud призван решить эту проблему путем интеграции ИИ во все операционные и аналитические системы. Эта новая платформа предлагает фреймворк для агентов, позволяющий получать доступ к корпоративным данным в режиме реального времени с высокой точностью и унифицированным управлением. Внедряются новые инструменты и агенты данных для повышения удобства разработки и использования. Конверсационный аналитический модуль расширяется на BigQuery, Lakehouse, AlloyDB, Spanner и Cloud SQL для взаимодействия с данными на естественном языке. Встраиваемый конверсационный аналитический модуль Looker позволяет интегрировать агентов непосредственно в пользовательские приложения. Доступен набор новых агентов данных для автоматизации задач и предоставления аналитической информации инженерам данных, ученым и администраторам баз данных. К ним относятся агенты для инженерии данных, науки о данных, наблюдения за базами данных и их ввода в эксплуатацию. Агент панелей управления Looker и конверсационный аналитический модуль в Gemini Enterprise упрощают доступ к аналитическим данным для бизнес-пользователей. Предоставляются такие инструменты, как Data Agent Kit и Managed MCP Servers, для поддержки интеграции разработчиков с экосистемой агентов. Эти достижения позволяют организациям более эффективно и безопасно использовать ИИ-агентов с корпоративными данными.
CdXz5zHNQW_wVdRRTFqPl.gif

Архитектура доверенной агентной платформы с использованием графовых технологий: пример Yahoo

Предприятия переходят от реактивной аналитики к проактивным системам действий для агентского ИИ. Agentic Data Cloud от Google Cloud обеспечивает этот переход, примером чего является платформа для покупки цифровой рекламы Yahoo Seller Agent. Yahoo в партнерстве с Google Cloud создала Seller Agent, превратив многонедельные ручные процессы в быстрые, управляемые кампании, выполняемые за секунды. Эта платформа демонстрирует, как автономные системы могут достигать скорости и подотчетности. Традиционные рабочие процессы, такие как кампании премиум-рекламы, были неэффективны, требуя значительного вмешательства человека и анализа. Простого внедрения LLM недостаточно без детерминированного понимания данных в реальном времени и ограничений. Надежная агентская платформа нуждается в достоверном источнике истины, чтобы избежать ошибок и обеспечить фактическую обоснованность. Регуляторы требуют объяснимости решений ИИ, связанных с реальными бюджетами, что требует встроенного управления и аудируемости. Yahoo Seller Agent, работающий на Google Cloud, представляет собой многоагентную систему, разработанную для обеспечения объяснимости и аудируемости. Ее архитектура включает граф знаний для обоснования решений в бизнес-реальности и граф контекста для аудируемой памяти. Граф знаний, основанный на Spanner Graph, моделирует бизнес-операции и политики, гарантируя, что агенты действуют на основе фактов. Граф контекста, использующий BigQuery Graph, фиксирует каждое действие как отслеживаемую запись для объяснимости. Эта двойная графовая основа обеспечивает быстрое выполнение через граф знаний и непрерывный аудит через граф контекста. Эта архитектура служит образцом для отраслей, нуждающихся в надежных автономных системах, обосновывая решения в бизнес-реальности и создавая аудируемую память.
CdXz5zHNQW_9rehc7XuNW.png

Взгляд CISO на облачные технологии: 4 урока, которые легли в основу защиты от угроз ИИ

Крис Бетц, новый директор по информационной безопасности Google Cloud, поделился четырьмя ключевыми уроками, извлеченными из разработки системы защиты от угроз на базе ИИ. ИИ значительно ускоряет обнаружение уязвимостей, позволяя защитникам находить тысячи недостатков за считанные минуты. Злоумышленники используют ИИ для изощренных атак, но защитники могут использовать аналогичные возможности в сочетании с контекстом своего бизнеса. Устаревшие ручные методы защиты больше не достаточны против угроз, действующих со скоростью машины. Фреймворк защиты от угроз на базе ИИ от Google включает в себя подготовку, сканирование, устранение последствий и мониторинг. Подготовка включает в себя сокращение поверхности атаки и создание надежной операционной структуры с согласованностью инженерных решений. Сканирование и приоритизация требуют экспертного анализа цепочки поставок программного обеспечения с помощью ИИ. Приоритизация смещается в сторону работы с базовым кодом с большим радиусом поражения в первую очередь. Устранение последствий фокусируется на поэтапном внедрении на основе рисков, всестороннем отслеживании и повышении устойчивости системы. Это включает в себя обновление, удаление или переписывание программного обеспечения с открытым исходным кодом для повышения безопасности. Мониторинг устанавливает непрерывный цикл обратной связи, отслеживает состояние устранения последствий и использует агентов ИИ для эволюции будущих угроз. Агенты ИИ автоматизируют сценарии реагирования и улучшают практики кодирования, в то время как красные команды проводят стресс-тестирование инфраструктуры. Такой подход обеспечивает постоянно развивающуюся и безопасную защиту.
CdXz5zHNQW_hQrhUBcQRP.png

Государственное и частное медицинское сообщество стало мишенью для киберпреступной группы, связанной с Китаем, которая преследует цели в области искусственного интеллекта, кибербезопасности, медицины и национальной обороны.

Утонченный китайский актор угроз, идентифицированный как UNC6508, нацеливался на североамериканские академические, медицинские и военные исследовательские учреждения. Этот актор оставался незамеченным более года, компрометируя веб-приложения и развертывая пользовательское вредоносное ПО под названием INFINITERED. UNC6508 стремился украсть конфиденциальные данные, включая разведданные национальной безопасности и передовые исследования. Основной метод заключался в использовании уязвимых серверов REDCap для получения учетных данных для входа. Получив доступ, актор перешел к внутренним системам и использовал новые методы для эксфильтрации данных. Google Threat Intelligence Group (GTIG) нарушила работу вредоносной инфраструктуры и уведомила пострадавшие организации. Они рекомендуют включить двухэтапную аутентификацию и использовать лучшие практики безопасности. INFINITERED использует модульный подход с дроппером, сборщиком учетных данных и бэкдором. Он поддерживает постоянство, внедряя код в процессы обновления REDCap. Сборщик учетных данных захватывает данные для входа, сохраняя их в зашифрованном виде в базе данных. Бэкдор позволяет выполнять команды для кражи данных и контроля над системой. Актор угроз также манипулировал правилами соответствия контента домена для скрытой эксфильтрации данных. GTIG сотрудничала с Mandiant Consulting и другими командами Google для предоставления комплексной информации об угрозах и помощи в устранении последствий.
CdXz5zHNQW_Kt1CMvP0Cs.png

Как я выучил Go за день с Antigravity 2.0 и как вы можете сделать то же самое

Автор стремился заменить ресурсоёмкий Node.js инструмент на эффективный Go CLI. Они определили архитектурные цели, включая ядро с нулевой зависимостью, скорость и модель безопасности с нулевой доверенностью. После рассмотрения альтернатив, таких как Rust, Python, Zig и Swift, Go был выбран за баланс функций. Агент ИИ помогал проверять существующий код и проверять отсутствие прямого порта Go. Проект начался с установки популярного навыка агента Go для обеспечения стандартных практик кодирования, соответствующих сообществу. Затем был проведен анализ пробелов, в ходе которого были уточнены архитектурные цели, а агент ИИ планировал миграцию. Миграция включала перевод конфигураций TypeScript в Go, отображение различных папок агентов. Логика онбординга пользователя была изолирована в отдельный файл. Для обеспечения функционального паритета был реализован цикл разработки, управляемый тестированием (TDD). ИИ генерировал тесты перед написанием производственного кода, начиная с парсинга фронтматера. Обработка ошибок была согласована с лучшими практиками Go, обеспечивая явные проверки ошибок и контекстную обёртку. Модульные тесты дополнялись сквозной интеграционными тестами для различных сценариев. Для управления большой поверхностью команд CLI использовались параллельные субагенты, при этом каждый агент сосредоточился на одной команде. Этот подход помог выявить недостающие варианты и тесты. Использовалась архитектурная схема «Слон и золотая рыбка», применяя постоянный координатор-агент и временные субагенты для конкретных задач. Структура пакета Go была окончательно утверждена, поддерживающая нативную установку. Был создан конвейер CI/CD с использованием матричной сборки для обеспечения кроссплатформенной совместимости. Несмотря на миграцию на Go, конвейер сохранил Node.js зависимости для помощников GitHub Actions. Последними аспектами стали подпись кода для распространения предварительно скомпилированных бинарных файлов.
CdXz5zHNQW_rpTWrPGL8F.jpeg

Представляем формат Open Knowledge

Для эффективной работы базовые модели нуждаются в соответствующем контексте, особенно в системах с агентами. Организации сталкиваются с фрагментированной средой внутренних знаний, разбросанных по различным системам. Для решения этой проблемы в качестве открытой спецификации вводится формат Open Knowledge Format (OKF). OKF формализует шаблон LLM-wiki в переносимый, совместимый и независимый от поставщика формат. Он представляет знания в виде каталога файлов Markdown с YAML-фронтматтером, используя простые соглашения для обеспечения совместимости. Этот формат позволяет различным производителям и агентам использовать знания без перевода. OKF разработан с минимальной привязкой к конкретным решениям, обеспечивая независимость производителей и потребителей и отдавая приоритет формату над проприетарной платформой. Каждая концепция представляет собой файл Markdown, идентифицируемый по пути к файлу, с YAML-фронтматтером для структурированных полей и Markdown для основного текста. Концепции связываются друг с другом через Markdown, создавая граф отношений. Референсные реализации включают агент обогащения и статический визуализатор HTML. Формат предназначен для развития за счет вклада сообщества. Knowledge Catalog от Google Cloud также будет использовать OKF. В конечном итоге OKF стремится стать лингва франка для обмена знаниями в приложениях искусственного интеллекта.

Обеспечение следующей эры конфиденциального ИИ

Google Cloud сотрудничает с Apple для обеспечения работы расширенных систем Private Cloud Compute (PCC). Это сотрудничество использует передовые технологии безопасности и конфиденциальности Google Cloud. В основе этого партнерства лежит портфель Google Cloud Confidential Computing, который защищает данные на протяжении всего их жизненного цикла. Архитектура безопасности Titanium с чипом Titan обеспечивает аппаратное корневое доверие для инфраструктуры Google. Confidential Computing использует доверенные среды выполнения (TEE) для шифрования данных даже во время их использования. PCC от Apple полагается на эти TEE, работающие на базе Intel TDX и NVIDIA Confidential Computing. Эта аппаратная изоляция обеспечивает высокозащищенную и конфиденциальную среду для чувствительных рабочих нагрузок ИИ. Чипы Google Titan являются неотъемлемой частью обеспечения целостности аппаратной платформы для PCC. Сотрудничество также включает в себя стек хоста с открытым исходным кодом для повышения прозрачности и независимой проверки свойств безопасности. Это совместное усилие создает надежную и проверяемую систему, разработанную для удовлетворения строгих требований Apple к конфиденциальности и безопасности для PCC. Эти достижения принесут пользу всем клиентам Google Cloud, особенно тем, кто работает с конфиденциальными данными ИИ.

Превратите дашборды в интерактивные аналитические решения с помощью агентов Looker

Традиционные дашборды, хоть и полезны, лишены интерактивности и не позволяют пользователям задавать уточняющие вопросы. Это часто нарушает рабочие процессы или требует помощи от аналитиков данных. Чтобы решить эту проблему, Looker представляет предварительную версию дашборд-агентов, позволяющих вести диалог для исследования данных непосредственно в дашбордах. Теперь пользователи могут взаимодействовать со своими данными бизнес-аналитики, используя естественный язык. Нажав на значок Gemini, пользователи могут начать разговор и получить контекстные сведения. Агент использует примененные фильтры, перекрестные фильтры и отобранные плитки для получения максимально релевантных ответов. Если требуется дополнительная информация, агент может получить доступ к базовым функциям Explores для более глубокого анализа, представленного в виде графиков и пояснений. Аналитики данных могут настраивать ответы агента, предоставляя инструкции на естественном языке, чтобы он точно интерпретировал бизнес-логику для конкретной аудитории. Эта возможность самообслуживания помогает командам аналитиков масштабировать свою работу. Дашборд-агент также обеспечивает доверие и прозрачность, показывая свои рассуждения, использованные плитки и примененные фильтры. Он работает в рамках существующей модели управления Looker, соблюдая разрешения пользователей. Администраторы могут включить эту функцию в Looker версии 26.08.11 и выше через настройки Gemini в Looker.
CdXz5zHNQW_yizylgs7nw.gif

ShinyHunters нацелились на образовательный сектор с помощью эксплойта Oracle PeopleSoft

Mandiant и Google Threat Intelligence Group сообщили об активной кампании вымогательства со стороны UNC6240, также известной как ShinyHunters, нацеленной на инфраструктуру Oracle PeopleSoft. Злоумышленники использовали CVE-2026-35273, критическую уязвимость нулевого дня для удаленного выполнения кода в компоненте Environment Management, в период с 27 мая по 9 июня 2026 года. Google уведомил более 100 организаций, преимущественно из сферы высшего образования, о потенциальном компромете. Открытые директории злоумышленников на промежуточных серверах выявили кастомизированные агенты MeshCentral, замаскированные под облачные конечные точки. Эти агенты использовались для развертывания кастомного скрипта для бокового перемещения и дефейса, [сокращение_жертвы]_fanout.sh. Эта активность напрямую коррелирует с утечками данных, опубликованными на сайте утечек данных ShinyHunters 9 июня 2026 года. Промежуточная инфраструктура размещала предварительно сконфигурированные агенты MeshCentral для Windows, маскирующиеся под сервисы Microsoft Azure. Анализ истории команд показал, что злоумышленники настраивали промежуточную среду, картировали конфигурации PeopleSoft и распространяли скрипт для бокового перемещения. Этот скрипт распылял SSH-учетные данные по внутренним хостам и развертывал маркер дефейса. Организациям, использующим Oracle PeopleSoft, рекомендуется немедленно заблокировать внешний сетевой доступ к конфиденциальным конечным точкам, таким как /PSEMHUB/hub и /PSIGW/HttpListeningConnector. Кроме того, рекомендуются такие меры безопасности, как аудит журналов доступа на предмет подозрительных POST-запросов и мониторинг исходящего SMB-трафика.
CdXz5zHNQW_SKa3xYLQeY.png

10 незаменимых запросов, без которых наша команда отказывается работать

Опытные разработчики не импровизируют; они полагаются на отточенные, проверенные подсказки для стабильной, высококачественной работы. Эти подсказки служат инструментами для снижения рисков, связанных с человеческими предположениями, и для проверки идей перед написанием кода. Майя Билич использует подсказку, чтобы воплотить циничного архитектора, уточняя требования к продукту и предотвращая избыточное проектирование. Эндрю Брогдон использует ИИ для часто упускаемых из виду тестов виджетов, уменьшая чувство вины и повышая надежность кодовой базы. Ая Хаммерли использует подсказки для поиска забытых TODO и очистки сообщений коммитов перед отправкой кода на проверку. Рич Хайндман использует подсказку для проверки разрешений приложения и выявления неиспользуемых, что крайне важно для соответствия требованиям Play Store. Подсказка Шир Меир Ладор заставляет ИИ проводить жесткий обзор кода, выявляя критические недостатки, а не предлагая вежливые замечания. Джеймс О'Райли использует подсказку для изучения компромиссов, удерживая ИИ в фокусе и позволяя разработчику контролировать решения. Эмма Тверски генерирует контрольные списки с помощью подсказок для выявления уязвимостей в коде, сгенерированном ИИ, предотвращая несоответствие доверия. Фред Зауэр проходит этапы исследования, концептуальной проверки, оценки и доработки, используя серию подсказок. Ремигиуш Самборски встраивает подсказку в GitHub Actions для автоматизированного обзора pull-запросов, освобождая человеческих рецензентов для задач более высокого уровня. Карл Вайнмайстер использует анализ DAG для подсказки ИИ при структурном тестировании, фокусируясь на критических границах и приоритизируя улучшения. Эти важные подсказки превращают ИИ в противника, гарантируя, что разработчики выпускают продукт с большей уверенностью.

Глубокое погружение: Как Lightning Engine обеспечивает в 4,9 раза более высокую производительность Apache Spark

Apache Spark является основной технологией для глобальной обработки данных, но увеличение объемов данных может привести к компромиссам в производительности и стоимости. Эра агентов, с многочисленными одновременными запросами, усугубляет эти узкие места и влияет на экономику единицы продукции. Управляемый сервис для Apache Spark теперь предлагает Lightning Engine, улучшение производительности, совместимое с существующими рабочими нагрузками Spark. Этот движок доступен как в бессерверном режиме, так и в режиме управляемых кластеров, предоставляя унифицированное решение для ускорения выполнения заданий. Lightning Engine продемонстрировал значительный прирост производительности, до 4,9 раз быстрее стандартного Spark, и предлагает превосходное соотношение цены и производительности по сравнению с альтернативами. Его основное новшество заключается в векторизованном нативном выполнении, компиляции планов Spark в оптимизированные инструкции C++, тем самым обходя накладные расходы JVM. Он достигает этого за счет векторизованной сортировки, ускоренных оконных функций и интеллектуального механизма отката для неподдерживаемых операторов. Кроме того, Lightning Engine оптимизирует коннекторы облачного хранилища и BigQuery для более быстрого извлечения данных. Он также может похвастаться расширенными функциями оптимизации запросов, такими как кэширование одной хэш-таблицы и вытеснение агрегатов. Начать работу легко: вы можете включить Lightning Engine через консоль Google Cloud или gcloud CLI. Этот релиз знаменует собой новый, интеллектуальный и более быстрый способ использования Spark.
CdXz5zHNQW_gyIAmWSUK1.jpeg

Выбор вашей платформы: Antigravity 2.0, Antigravity CLI, Antigravity IDE или Antigravity SDK

Antigravity предлагает четыре различных интерфейса для оркестровки автономных агентов, все они работают на основе общей базовой системы. Antigravity 2.0 — это настольное приложение, идеально подходящее для одновременного управления несколькими задачами в независимых проектах, позволяющее пользователям отслеживать и планировать работу, не нарушая основное рабочее пространство. Для энтузиастов командной строки и сценариев безголового выполнения Antigravity CLI предоставляет быстрый опыт работы в терминале. Разработчики, желающие работать непосредственно с агентами и просматривать изменения кода построчно, найдут Antigravity IDE особенно полезной, поскольку она предлагает интегрированную отладку и исправления в один клик. Antigravity SDK, библиотека Python, позволяет пользователям создавать и развертывать собственных настраиваемых агентов. Этот SDK предоставляет доступ к тем же инструментам и правилам, которые используются в официальных инструментах Antigravity от Google, что позволяет осуществлять локальную разработку и бесшовное развертывание в Google Cloud. Все интерфейсы поддерживают плагины и навыки, обеспечивая последовательный доступ к основной логике независимо от выбранного интерфейса. Пользователи могут выбрать инструмент, который наилучшим образом соответствует их рабочему процессу и потребностям проекта. Дополнительные руководства и документация доступны на веб-сайте antigravity.google, а загрузки — на специальной странице.
CdXz5zHNQW_f0XTUFrYdX.png

Клод Фабл 5: Доступно в Google Cloud

Claude Fable 5, новейшая передовая модель Anthropic, теперь общедоступна в Google Cloud. Этот запуск является очередным подтверждением нашей неизменной приверженности предоставлению новейших отраслевых моделей непосредственно на нашей платформе Agent Platform. Claude Fable 5 предоставляет всем клиентам лучшие возможности модели Anthropic с надежными мерами безопасности, разработанными для обеспечения ее безопасного общего использования. Claude Fable 5, разработанная для сложного многоэтапного рассуждения, отлично подходит для требовательных задач, таких как продвинутая разработка программного обеспечения, агенты с длительным горизонтом и глубокий мультимодальный анализ документов. Для получения дополнительной информации об этом выпуске посетите блог Anthropic. Создавайте с помощью Claude Fable 5 и других моделей от Anthropic — включая Claude Opus 4.8 и Claude Sonnet 4.6 — уже сегодня на платформе Agent Platform.

Gemini для правительства: Ваш план достижения целей миссии

Государственный сектор переходит от экспериментов с ИИ к практическому применению, требуя интегрированных решений, выходящих за рамки отдельных моделей. Google Cloud предлагает унифицированный стек ИИ для осуществления этой трансформации в эпоху агентов. Этот стек построен на базе AI Hypercomputer, оптимизированного для масштабирования и работающего на передовой инфраструктуре, такой как TPU. Он обеспечивает интеллектуальные возможности благодаря передовым моделям Google, включая Gemini 3.5, а также сторонним решениям. Агентное облако данных обеспечивает привязку ИИ к доверенным организационным данным, создавая "систему действий" с такими прорывами, как Cross-cloud Lakehouse. Агентная защита обеспечивает защиту по принципу нулевого доверия для всего жизненного цикла ИИ, усиленную AI Threat Defense. Gemini Enterprise Agent Platform облегчает создание, масштабирование и управление агентами, с готовыми специализированными агентами, такими как Workspace Intelligence, готовыми к немедленному использованию. Безопасность имеет первостепенное значение, включая панель управления AI Control Dashboard, реестр агентов Agent Registry и Model Armor для комплексной защиты. Gemini for Government имеет авторизацию FedRAMP High и гарантию конфиденциальности данных, а также новые инструменты для защиты кода, сгенерированного ИИ. Масштабирование агентов достигается с помощью таких инструментов, как Agent Designer, позволяющих нетехническим пользователям создавать агентов через интерфейсы без кода. Эта инициатива направлена на автоматизацию задач, повышение производительности и высвобождение персонала для сосредоточения на критически важной работе. Команды государственного сектора уже видят значительный рост производительности благодаря генеративному ИИ, при этом многие сообщают как минимум об удвоении производительности сотрудников. Gemini for Government предоставляет план перехода от пилотных проектов к масштабируемым приложениям, способствующим выполнению миссий. Технология усиливает человеческие возможности и ускоряет принятие решений.
CdXz5zHNQW_omvR9Ok88T.png

Наборы данных Storage Insights: Обеспечение оперативного обнаружения в масштабах организации с помощью аналитики активности

Рабочие нагрузки искусственного интеллекта трансформируют хранилища из пассивных репозиториев в активные платформы данных. Миллиарды объектов неструктурированных данных и связанные с ними действия требуют глубокого понимания доступа к данным, их перемещения и модификации. Наборы данных Google Cloud Storage Insights теперь предоставляют аналитику активности, обеспечивая видимость операционных деталей ресурсов Cloud Storage. Эти новые представления позволяют оптимизировать затраты на основе данных и ускорить устранение неполадок для администраторов. Например, пользователи могут определить, находятся ли объекты в правильных классах хранения или оптимально ли расположены регионы корзин. Выявление операционных ошибок в системе хранения и понимание их первопричин становится более управляемым. Наборы данных Storage Insights предоставляют ежедневные метаданные и частые аналитические данные об активности, как правило, в течение четырех часов. Эти аналитические данные доставляются в виде готового к запросам индекса BigQuery, заменяя ручной сбор данных. Наборы данных предлагают активность на уровне объектов, агрегированную активность на уровне корзин, региональный трафик и агрегированную активность на уровне проектов. Это позволяет динамически анализировать жизненный цикл данных, выходя за рамки статических снимков. Аналитика активности может использоваться для правильного определения размера хранилища путем выявления неиспользуемых данных. Они также помогают в проектировании для глобальной производительности путем анализа региональных моделей трафика. Кроме того, эти аналитические данные помогают разобраться и устранить операционные "горячие точки", такие как всплески кодов ошибок.
CdXz5zHNQW_bsDbZO9A6w.png

Как раскрыть истинную рентабельность инвестиций в разработку программного обеспечения – глубокое погружение в последние исследования DORA

Чтобы доказать деловую ценность генеративного ИИ, руководители технологических и финансовых компаний должны продемонстрировать четкую окупаемость инвестиций для текущего финансирования. Успех зависит от создания необходимых организационных систем и культуры для внедрения ИИ. Отчет DORA: ROI разработки программного обеспечения с помощью ИИ предлагает практический подход для команд, сталкивающихся с трудностями раннего внедрения. Ключевые выводы подчеркивают важность реалистичных ожиданий относительно получения ценности от ИИ, которая часто следует J-образной кривой. Эта J-образная кривая включает временное снижение производительности из-за кривой обучения, налога на проверку и адаптации конвейера. Бюджетирование этого начального этапа обучения имеет решающее значение для устойчивого прогресса. Отчет также выявляет рыночный разрыв в отдаче от ИИ, причем организационная поддержка в значительной степени влияет на успех. Расчет рентабельности инвестиций в ИИ имеет важное значение, фокусируясь на таких областях, как снижение затрат, повышение производительности и улучшение безопасности на протяжении всего жизненного цикла разработки программного обеспечения. Интерактивный калькулятор рентабельности инвестиций доступен для прогнозирования расходов и реалий внедрения ИИ. Руководители могут загрузить полный отчет и попробовать калькулятор, чтобы построить обоснованное бизнес-обоснование для инвестиций в ИИ.
CdXz5zHNQW_JeLAU2eN3Q.jpeg

Отчет: GKE Inference Gateway обеспечивает до 92% более быстрые ответы ИИ

Производственная среда генеративного ИИ требует эффективности инфраструктуры, и GKE Inference Gateway предлагает решение, интеллектуально маршрутизируя рабочие нагрузки ИИ. Он выходит за рамки базовой балансировки нагрузки, используя расширенные функции, такие как кэширование префиксов и маршрутизация с учетом моделей. Это гарантирует, что запросы направляются к уже подготовленным для них ускорителям, оптимизируя использование оборудования и время отклика. Независимые тесты показывают, что GKE Inference Gateway значительно превосходит конкурентов по пропускной способности, времени до первого токена и задержке между токенами. Snap Inc. также добилась успеха, достигнув высоких показателей попадания в кэш префиксов и бесшовной интеграции с существующей инфраструктурой. Кэширование префиксов работает путем хранения состояний активации для повторяющихся префиксов запросов, устраняя избыточную переработку. Это особенно полезно для ответов на вопросы по документации и кодовой базе с использованием генерации, дополненной извлечением информации. Аналогично, в сценариях многоходовых чатов кэширование системных персон и бизнес-правил обеспечивает постоянную отзывчивость. Технология обходит необходимость для больших языковых моделей переоценивать статический контекст для каждого запроса. Превосходная производительность GKE была подтверждена в отчете о тестировании, сравнивающем его со стандартной управляемой службой Kubernetes. Результаты подчеркнули существенные улучшения GKE в скорости обработки и задержке. Минимизируя задержку и максимизируя эффективность, GKE Inference Gateway делает приложения генеративного ИИ готовыми к производству и экономически эффективными.
CdXz5zHNQW_Q5fGhEs1eh.jpeg

Обнаружение и сдерживание угроз на базе ИИ с помощью агентов Google Security Operations

Организации сталкиваются с растущей угрозой со стороны противников, усиленных ИИ, что требует более быстрых ответных мер. Google AI Threat Defense — это автоматизированная система, разработанная для борьбы с этими угрозами, основанными на ИИ. Она работает по четырехэтапной схеме: подготовка, сканирование и приоритизация, устранение и мониторинг. Google Security Operations работает совместно с AI Threat Defense для мониторинга, обнаружения и реагирования на угрозы, особенно те, которые связаны с неустранимым кодом. Эксплуатация уязвимостей является наиболее распространенным вектором первоначального заражения, причем эксплуатация часто происходит до появления исправлений. Google Security Operations предоставляет операционную основу для автономного сдерживания активных атак в масштабах всей среды. Он обеспечивает межсредовую видимость благодаря непрерывному анализу, автономному расследованию и реагированию, а также ретроспективному поиску. Агент Detection Engineering преобразует новые шаблоны эксплуатации в пользовательские обнаружения, анализируя различные источники входных данных для выявления вредоносной активности. Агент Triage and Investigation автономно расследует оповещения, сокращая время анализа с минут до секунд. Агентская автоматизация объединяет ИИ-агентов с плейбуками для сдерживания атак, позволяя аналитикам сохранять контроль, автоматизируя рабочие процессы. Агент Threat Hunting обеспечивает проактивный поиск скрытых действий противника и аномалий, которые обходят традиционные средства защиты. Интегрируя этих агентов, организации могут автономно генерировать обнаружения, оркестрировать сдерживание и искать угрозы со скоростью машины, значительно снижая риски и затраты, связанные с утечками данных.
CdXz5zHNQW_UNHT6iJl7X.png

Модернизация здравоохранения: как Alcidion добилась большей стабильности и производительности с AlloyDB

Alcidion, поставщик интеллектуальных решений для здравоохранения, стремится снизить когнитивную нагрузку на клиницистов и предоставлять критически важную информацию в нужное время. Их флагманская платформа Miya Precision помогает управлять потоком пациентов и предотвращать неблагоприятные исходы. Ранее Alcidion сталкивался с узкими местами в производительности и операционными издержками в своей среде Microsoft SQL Server, особенно при обработке сложных данных JSON и проблемах со стабильностью. Для решения этих проблем Alcidion перенес свою платформу на AlloyDB для PostgreSQL от Google Cloud. Миграция, с использованием службы миграции баз данных Google Cloud, была завершена эффективно, при этом основной перенос занял чуть больше недели. Alcidion добился кратковременного переключения за 15 минут, создав собственные инструменты синхронизации и используя управляемые сервисы Google Cloud. Этот переход устранил задачи управления плоскостью управления и административные накладные расходы, связанные с управлением базами данных. Результаты были значительными: время обработки данных сократилось с 30 минут до менее чем одной минуты. Стабильность резко улучшилась, избавив команду от постоянного "тушения пожаров", связанных с проблемами инфраструктуры. Этот шаг также снизил административную нагрузку на их команду SRE, позволив им сосредоточиться на инновациях в продуктах. Alcidion рассматривает эту модернизацию как фундаментальный шаг для будущего роста, включая изучение колоночного движка AlloyDB и интеграцию генеративного ИИ. Этот стратегический шаг позволяет Alcidion продолжать предоставлять более интеллектуальные и безопасные решения для здравоохранения по всему миру.

Поиск консультаций: продолжающаяся целенаправленная кампания против юридических фирм США

Финансово мотивированная кампания по краже данных и вымогательству со стороны группы угроз UNC3573 была нацелена на организации в сфере профессиональных, юридических и финансовых услуг. UNC3573 использует голосовой фишинг и социальную инженерию для получения удаленного доступа, часто выдавая себя за службу поддержки ИТ. Они убеждают жертв делиться экранами и загружать инструменты удаленного мониторинга для поиска и кражи конфиденциальных данных. В некоторых случаях злоумышленники получали физический доступ к офисам, выдавая себя за ИТ-специалистов, чтобы украсть данные с помощью USB-накопителей. Жизненный цикл кампании быстр, кража данных и вымогательство происходят во многих случаях в течение одного рабочего дня. Первоначальный доступ обычно достигается с помощью безобидных электронных писем на тему счетов, предназначенных для вызова опасений по поводу безопасности, за которыми следуют прямые звонки с использованием вишинга. Злоумышленники используют легитимные инструменты, такие как Zoom, Teams и агенты RMM, и применяют самоуничтожающиеся заметки для доставки команд и ссылок. Они также злоупотребляют средами BYOD для проникновения в корпоративные сети и нацеливаются на системы управления документами для получения конкретных конфиденциальных файлов. Методы кражи данных включают загрузку в облачные хранилища, использование FTP-утилит и просьбы к жертвам отправлять украденные файлы по электронной почте. Коммуникации с целью вымогательства агрессивны, требуют выкуп в течение трех дней и угрожают публиковать данные и связываться с сотрудниками и клиентами.
CdXz5zHNQW_YqBOAUO037.png

Что нового в управляемом сервисе для кластеров Apache Spark

Dataproc от Google Cloud, теперь управляемый сервис для Apache Spark, предлагает два режима развертывания: бессерверный для разовых заданий и управляемые кластеры для индивидуальных потребностей. Управляемые кластеры были переосмыслены с акцентом на скорость, простоту использования и интеллектуальность. Значительным улучшением является Lightning Engine, нативный движок выполнения на C++, который значительно ускоряет запросы Spark DataFrame и SQL. Этот движок обеспечивает до 4,9 раз более высокую производительность и улучшенное соотношение цены и производительности без необходимости изменения кода. Гибкие виртуальные машины были введены для повышения отказоустойчивости кластера, позволяя отдавать предпочтение ранжированным типам машин. Функции FinOps, такие как кластеры с нулевым масштабированием и запланированные остановки, обеспечивают лучший контроль затрат для сред разработки. Сервер MCP интегрирует генеративный ИИ, позволяя ИИ-ассистентам взаимодействовать с кластерами Spark, используя естественный язык для операций. Data Agent Kit позволяет специалистам по данным управлять полным жизненным циклом своих рабочих нагрузок с данными в предпочитаемых средах разработки, интегрируясь с такими инструментами, как Gemini. Lakehouse следующего поколения обеспечивает бесшовную совместимость между Spark и BigQuery, обрабатывая данные непосредственно из облачного хранилища или даже удаленных наборов данных AWS. Cluster Image 3.0 с Spark 4.1 и Java 21 представляет возможности потоковой передачи в реальном времени для непрерывной обработки с низкой задержкой. Эти обновления доступны сейчас для управляемых кластеров Spark, доступных через консоль Google Cloud и gcloud CLI.
CdXz5zHNQW_lTUdK8PnPj.jpeg

Масштабирование ИИ-агентов: Пошаговое руководство по развертыванию ADK на GKE Autopilot

Этот учебник проведет вас через развертывание агента Google Agent Development Kit (ADK) в Google Kubernetes Engine (GKE) Autopilot. Он начинается с объяснения архитектуры, которая включает упаковку агента ADK в образ Docker, хранящийся в Artifact Registry, и его запуск в GKE Autopilot. Агент будет взаимодействовать с Vertex AI, используя Workload Identity для безопасного управления разрешениями. Предварительные требования включают Python, gcloud SDK, kubectl и включение определенных API. Первоначальные шаги включают настройку вашей среды Google Cloud, где вы аутентифицируетесь и устанавливаете свой проект. Затем вы подготавливаете кластер GKE Autopilot, который работает в фоновом режиме, пока вы создаете агента. Агент ADK создается с помощью CLI и настраивается для использования Gemini в Vertex AI. Перед развертыванием агент тестируется локально через его веб-интерфейс для обеспечения функциональности. Для развертывания вы контейнеризуете агент ADK, создав Dockerfile и собрав образ, а затем отправив его в Artifact Registry. Затем реализуется Workload Identity путем создания учетной записи службы IAM и предоставления ей необходимых ролей Vertex AI. После этого вы создаете ресурсы Kubernetes, включая учетную запись службы с аннотацией для Workload Identity, развертывание для агента и службу для его внутреннего доступа. Агент развертывается в GKE с помощью kubectl, и его статус проверяется. Взаимодействие с развернутым агентом демонстрируется с помощью команд `curl` к его API. При желании агент может быть доступен извне с использованием GKE Gateway API с управляемым Google сертификатом TLS для безопасного доступа по HTTPS. Это включает резервирование статического IP-адреса, создание SSL-сертификата и определение ресурсов Gateway и HTTPRoute.

Что нового в бессерверном управляемом сервисе Apache Spark

Запуск Apache Spark в больших масштабах требует значительных ресурсов и экспертного управления. Бессерверный управляемый сервис Apache Spark от Google Cloud, в частности его версия среды выполнения 3.0, призван упростить это, уделяя первостепенное внимание скорости, простоте и надежности. Использование этого сервиса клиентами для науки о данных почти удвоилось за год, что указывает на его растущее внедрение. Сервис значительно сокращает время, необходимое для начала выполнения рабочих нагрузок, благодаря нулевой настройке при онбординге, автоматизации разрешений, сетевых настроек и управления API. Время запуска для критически важных рабочих нагрузок сократилось на 75%, что делает бессерверный Spark подходящим для более широкого спектра приложений. Улучшенная доступность GPU достигается за счет режима Flex Start планировщика динамических рабочих нагрузок, который ставит запросы в очередь при недоступности GPU. Среда выполнения 3.0 предлагает первоклассную поддержку инноваций Apache Spark 4.x, включая Spark Connect для раздельного подключения. Улучшенная многозональная поддержка теперь является функцией по умолчанию, распределяя узлы выполнения по зонам в пределах региона для повышения доступности без дополнительных затрат на межзональный трафик. Google Cloud постоянно внедряет инновации для дальнейшего повышения удобства использования в таких областях, как автонастройка и автомасштабирование. Пользователи могут начать использовать эти функции, указав runtime_version: 3.0 в своих рабочих нагрузках.
CdXz5zHNQW_FXigucFN3T.jpeg

Соединение ИИ-агентов с неструктурированными данными с использованием серверов Google Cloud Storage MCP

Google Cloud Storage (GCS) незаменим для неструктурированных данных в агентских системах. Сейчас основное внимание уделяется преобразованию этих данных в действенный контекст для агентов. Интеллектуальное хранилище в GCS подготавливает данные для агентов, обогащая пассивные объекты. Успех ИИ зависит от беспрепятственного доступа агентов к этой информации для принятия решений. В этом блоге представлены три примера использования агентов на базе GCS и объясняется, как безопасно подключать агентов с помощью протокола контекста модели (MCP). Серверы GCS MCP в сочетании с функциями интеллектуального хранения упрощают развертывание агентов. Strata Co-Pilot от Palo Alto Networks использует GCS в качестве своей исторической памяти. AI Assistant от Airwallex использует GCS для хранения документов и метаданных. Агент оптимизации заданий Snap анализирует данные заданий в GCS для поиска эффективных решений. MCP является универсальным стандартом для данных агентов, а GCS предлагает варианты удаленных и локальных серверов MCP. Полностью управляемый удаленный сервер MCP не требует инфраструктуры и обеспечивает немедленный доступ к данным GCS. Он интегрируется с основными агентскими фреймворками и обеспечивает надежную безопасность с помощью IAM и журналов аудита. При желании можно интегрировать Google Cloud Model Armor для расширенной защиты от угроз. Локальный сервер MCP, управляемый пользователем, идеально подходит для создания пользовательских инструментов и специфической бизнес-логики, такой как специализированные преобразования данных. Это вариант с открытым исходным кодом для большей настройки. Локальный MCP GCS теперь является частью набора инструментов MCP для баз данных, упрощая разработку и повышая безопасность. Пользователи могут ознакомиться с удаленным сервером MCP или репозиторием GitHub локального MCP, чтобы начать работу.
CdXz5zHNQW_PxY9PQk0UJ.gif

Анонсируем графовые алгоритмы Spanner: интеллектуальные решения уровня Google для связанных данных

Google Cloud представил алгоритмы Spanner Graph, позволяющие пользователям выполнять расширенный анализ графов непосредственно в своей базе данных. Эта функция предоставляет клиентам Google Cloud передовые возможности Google Research в области интеллектуального анализа графов. Предприятия могут использовать эти новые возможности для более быстрого и эффективного получения ценной информации из сложных связанных данных. Графовые технологии все чаще используются для таких приложений, как обнаружение мошенничества, анализ социальных сетей и исследования в области здравоохранения. Исторически сложилось так, что выполнение графовых алгоритмов в больших масштабах было сложной задачей, требующей сложных конвейеров данных или влияющей на производительность транзакций. Алгоритмы Spanner Graph разработаны для обработки требовательных рабочих нагрузок без ущерба для производительности операционной базы данных. Они обеспечивают тесную интеграцию с GQL, позволяя напрямую вызывать алгоритмы наряду со стандартными запросами, минимизируя перемещение данных. Выполнение алгоритмов происходит на выделенных вычислительных ресурсах, что обеспечивает практически нулевое влияние на трафик в реальном времени. Этот новый движок может обрабатывать огромные графы с миллиардами ребер за считанные минуты, оптимизируя производительность за счет плотного кодирования данных. Spanner Graph объединяет реляционные и графовые модели, позволяя разработчикам запрашивать связанные данные с использованием ISO GQL. Новые алгоритмы помогают выявлять скрытые закономерности и инсайты в связанных данных, такие как обнаружение мошенничества или рекомендации продуктов. Ключевые алгоритмы включают Центральность, Обнаружение сообществ и Поиск сходства и путей. Пользователи могут вызывать эти алгоритмы напрямую с помощью GQL и записывать результаты обратно в Spanner Graph или Cloud Storage. Примеры демонстрируют, как эти алгоритмы могут быть использованы для выявления главарей мошеннических схем путем объединения обнаружения сообществ и PageRank. Лидеры отрасли, такие как DaVita, Yahoo! и SoundCloud, уже используют алгоритмы Spanner Graph для решения своих сложных задач, связанных с данными.
CdXz5zHNQW_KLmuPh1ZYo.jpeg

Ускорение озер данных: Оптимизация Apache Iceberg и Spark с помощью gcs-analytics-core

gcs-analytics-core, новая библиотека с открытым исходным кодом на Java, призвана решить проблемы, с которыми сталкиваются инженеры данных при работе с Google Cloud Storage, связанные с совместимостью и производительностью при использовании нескольких аналитических движков. Эта библиотека предлагает гибкость в выборе аналитических движков, обеспечивая при этом высокую производительность на GCS. Она предлагает оптимизации для существующих аналитических движков GCS, таких как Iceberg Spark, и планирует расшириться на другие. Библиотека консолидирует и повышает производительность аналитических рабочих нагрузок на GCS, интегрируясь нативно с Apache Iceberg начиная с версии 1.11.0. Она улучшает операции чтения для колоночных форматов, таких как Parquet, выступая в качестве централизованного слоя оптимизации между аналитическими движками и Java SDK GCS. Ключевые технические оптимизации включают многопоточный векторизованный ввод-вывод для параллельного получения диапазонов данных и интеллектуальное предварительное чтение Parquet для метаданных. Первая крупная интеграция — с Apache Iceberg, где движки, использующие GCSFileIO, автоматически получают преимущества от этих улучшений. Библиотека совместима со всеми каталогами Iceberg, предлагая постоянные улучшения чтения без изменений инфраструктуры. Тесты TPC-DS с использованием Spark и Iceberg продемонстрировали значительное сокращение времени сканирования и выполнения для различных размеров наборов данных. Для начала работы пользователям потребуется среда выполнения Apache Iceberg Spark 1.11.0+, настроенный GCSFileIO и включенные специальные флаги оптимизации. Библиотека имеет открытый исходный код, размещена на GitHub и приветствует вклад сообщества и обратную связь.
CdXz5zHNQW_mMXNFmmBfk.jpeg

Эксперименты с TPU, GKE Managed DRANET и шлюзом для межкластерного инференса

Этот блог посвящен настройке высокодоступной рабочей нагрузки для инференса ИИ на Google Kubernetes Engine. Цель — обеспечить доступ к сервису даже в случае сбоя одного региона, используя такие функции, как динамическое выделение ресурсов (DRA) и Inference Gateway. В эксперименте используется управляемый DRANET на Google Kubernetes Engine (GKE) для совместного использования ресурсов между подами, поддерживая TPU в разных регионах. Многокластерный GKE Inference Gateway балансирует рабочие нагрузки ИИ/МО между несколькими кластерами, что крайне важно для сценариев аварийного переключения. Cloud Storage FUSE обеспечивает централизованное хранение моделей и журналов, ускоряя развертывание. Виртуальная частная сеть (VPC) обеспечивает безопасную связь, а GKE Fleets унифицирует управление кластерами. В настройке используются ускорители TPU v6e для высокопроизводительных вычислений ИИ. Дизайн включает развертывание большой языковой модели в двух кластерах GKE в разных регионах, каждый из которых использует четыре чипа TPU v6e. Модель хранится в Cloud Storage, а трафик направляется глобально с возможностью аварийного переключения. Основные строительные блоки включают конфигурацию VPC и подсети, правила брандмауэра и резервирование статических IP-адресов для шлюза. Кластеры создаются с включенными API Gateway и драйвером CSI Cloud Storage FUSE, а также выделенными пулами узлов TPU v6e. Управляемый DRANET включен в этих пулах узлов для ускоренной работы сети. Кластеры регистрируются в GKE Fleet для унифицированного управления, обеспечивая межкластерное обнаружение сервисов и ингресс. Рабочая нагрузка ИИ включает загрузку весов модели в Cloud Storage и развертывание серверов инференса, которые используют DRANET для доступа к TPU. Многокластерный Inference Gateway настраивается с пользовательскими определениями ресурсов, метриками автомасштабирования и InferencePool для унифицированного развертывания. Наконец, шлюз настраивается для направления трафика в наиболее доступный регион, а тестирование подтверждает бесшовное переключение на вторичный кластер во время имитированного сбоя.
CdXz5zHNQW_UvLTnPEClj.png

Полностью управляемый удаленный сервер MCP для AlloyDB теперь общедоступен.

Для надежной работы ИИ-агентам требуется высококачественный, доступный контекст, который часто находится в операционных базах данных. Для решения этой задачи Google Cloud выпустил сервер Remote Model Context Protocol (MCP) для AlloyDB, который теперь общедоступен. MCP — это стандарт с открытым исходным кодом, позволяющий LLM безопасно подключаться к внешним источникам данных. Эта интеграция позволяет ИИ-агентам получать доступ к корпоративным данным AlloyDB в режиме реального времени, предотвращая неточности из-за устаревшей информации. AlloyDB обеспечивает надежную основу для агентных приложений благодаря превосходной векторной производительности, расширенным возможностям поиска и аналитике в реальном времени с помощью встроенных функций искусственного интеллекта. Он предлагает унифицированный доступ к данным, позволяя беспрепятственно объединять данные из таблиц AlloyDB, BigQuery и Iceberg. Сервер Remote MCP для AlloyDB работает на управляемой инфраструктуре Google Cloud, упрощая подключение для производственных рабочих нагрузок. Он включает централизованное обнаружение, полностью управляемые конечные точки HTTP и детальную авторизацию с использованием Google Cloud IAM для повышения безопасности. Набор инструментов AlloyDB также предоставляет агентам управление операционными экземплярами и защиту Model Armor от утечки данных. Журналирование аудита обеспечивает полный след всех действий агента. Начало работы включает подготовку API, предоставление базы данных и настройку агента с удаленной конечной точкой и учетными данными IAM. Это позволяет агентам предоставлять надежные, обоснованные ответы, понимая схемы баз данных и выполняя сложные запросы, улучшая корпоративные агентные приложения.
CdXz5zHNQW_ZmZ1bXr5CP.gif

Представляем буфер ожидания GKE: Ускорьте запуск узлов, не выходя за рамки бюджета

Google Kubernetes Engine представил новую функцию под названием "буферы ожидания" для решения проблемы компромисса между производительностью приложений и затратами. Ранее избыточное выделение ресурсов гарантировало быстрый запуск, но было дорогостоящим, в то время как минимизация затрат приводила к медленным холодным стартам. Буферы ожидания GKE предлагают недорогой буфер приостановленной мощности для кластеров. Эта функция основана на активных буферах GKE, которые обеспечивают готовую мощность для обработки всплесков трафика с задержкой запуска, близкой к нулю. Буферы ожидания поддерживают приостановленную мощность, которая влечет за собой минимальные затраты, обычно в низких однозначных процентах. По сравнению с кластером без буферов ожидания, кластер, использующий их, продемонстрировал значительно меньшую задержку при одинаковых нагрузках трафика. Кластер с буферами ожидания поддерживал задержку P50 в однозначные секунды, при этом показатели P95 и P99 кратковременно достигали одной минуты. Традиционное автомасштабирование Kubernetes медленное и требует обходных путей, таких как снижение пороговых значений HPA или управление "баллонными" подами. Эти обходные пути часто дороги и сложны в эксплуатации. Активные буферы и буферы ожидания GKE предлагают декларативный подход к управлению мощностью, устраняя необходимость в ручной настройке. Буферы ожидания снижают затраты на инфраструктуру, приостанавливая вычислительную мощность и неся только расходы на постоянный диск и IP-адрес. В сочетании с активными буферами они обеспечивают почти мгновенное планирование подов с производительностью, сравнимой с избыточным выделением ресурсов, но по гораздо более низкой цене. Система отдает приоритет пополнению активного буфера из буфера ожидания, который обрабатывает длительные нагрузки и защищает от медленных холодных стартов узлов. Буферы ожидания возобновляются в 2-3 раза быстрее, чем создание нового узла, эффективно сокращая разрыв между холодными стартами и постоянно включенной мощностью. Эта функция позволяет компаниям динамически балансировать производительность и затраты для различных рабочих нагрузок.
CdXz5zHNQW_8oX6vyeOVS.png

Как Trustpilot построила архитектуру обработки данных в реальном времени для обогащения данных с помощью Gemma

Trustpilot обрабатывает миллионы пользовательских отзывов ежедневно, что является сложной задачей с жесткими ограничениями по задержке и стоимости. Они переходят на свою основную стратегию ИИ к генеративному ИИ, сотрудничая с Google для построения высокообъемной потоковой трубы с использованием тонко настроенных моделей Gemma. Этот шаг позволяет Trustpilot извлекать глубокие, действенные знания из отзывов, выполняя задачи, такие как распознавание именованных сущностей, категоризация, оценка настроений и определение намерений. Выбор тонкой настройки открытых моделей веса, таких как Gemma, обеспечивает Trustpilot полную независимость модели, предсказуемую экономику и расширенные возможности MLOps. Они построили набор специализированных моделей на основе легковесной модели google/gemma-2-9b. Высококачественные обучающие наборы данных были сгенерированы с использованием моделей учителей Gemini и консенсусной аннотации по стратифицированной выборке отзывов. Эти наборы данных позволили тонко настроить пользовательские модели, которые превосходили устаревшие решения и приблизились к точности моделей учителей. Архитектура системы использует Dataflow и конечные точки платформы Gemini Enterprise Agent, декуплируя бизнес-логику от сырого вывода LLM для масштабируемости. Настройка производительности была сосредоточена на оптимизации vLLM на виртуальных машинах A2 с GPU A100 и настройке бэкенда vLLM для высоких объемов потоковой передачи. Среди проблем были ограничения частной сети, наблюдаемость развертывания и нехватка GPU в регионе ЕС. В конечном итоге Trustpilot достигла производительности, аналогичной Gemini, при доле стоимости, превратив миллионы отзывов в мгновенные, действенные знания.
CdXz5zHNQW_BiOLPvCRmR.png

Моделирование цифрового двойника цепочки поставок продуктов питания с использованием BigQuery Graph

Развитие сети ресторанов представляет уникальные проблемы, которые традиционные таблицы не могут эффективно решить. Эти проблемы включают эффект бичевания в цепочке поставок, эрозию последовательности бренда из-за отклонения от стандартных операционных процедур, широкое воздействие проблем безопасности пищевых продуктов и финансовые потери из-за нерегламентированных расходов. Для управления этими сложностями необходим цифровой аналог бизнеса, известный как цифровой двойник. Хотя реляционные базы данных были стандартными, их ограничения в отслеживании зависимостей становятся очевидными при крупномасштабных операциях. BigQuery Graph предлагает решение, позволяя пользователям создать цифровой двойник своей цепочки поставок внутри своей существующей платформы данных. Это достигается путем моделирования физических сущностей, таких как предметы и местоположения, как сети узлов и ребер. Система определяет семантический слой, создавая представление графа над существующими таблицами, иллюстрируя их отношения. Этот подход смещает операции от реактивного решения проблем к проактивной точности, позволяя проводить хирургические отзывы и подробный анализ рисков. Запросы графа упрощают сложный анализ данных, делая его проще отслеживать отношения и получать информацию быстро. Для оптимальных результатов сосредоточьтесь на структурировании отношений с помощью графов, обеспечивайте целостность данных с помощью чистых ключей и захватывайте метаданные на ребрах графа. В конечном итоге, BigQuery Graph позволяет бизнесу выйти за рамки управления данными как простых списков и вместо этого визуализировать критические междоменные отношения за считанные секунды.
CdXz5zHNQW_scvEnWRnwp.png

Перспективы облачного CISO: Как создать готовую к ИИ программу безопасности для государственного сектора

Этот выпуск Cloud CISO Perspectives посвящен созданию готовых к работе с ИИ программ безопасности для правительства и критической инфраструктуры. Статья Усмана Чаудхари представляет собой дорожную карту для специалистов по информационной безопасности, выделяя практические шаги. Суть подхода заключается в создании пользовательских рабочих процессов, интеграции коммерческого ИИ и включении их в существующую систему безопасности. Рекомендуемый план включает в себя 90-дневный фокус, с тактическими целями в течение шести месяцев и стратегическими задачами в течение шести-двенадцати месяцев. Эти инициативы организованы по пяти доменам рабочей нагрузки CISO для эффективного распределения ресурсов и немедленных побед. Немедленные действия включают согласование с руководством для обоснования бизнеса, автоматизацию сбора контекста и оптимизацию поставщиков. Анализ угроз, интеграция стандартных операционных процедур и развитие талантов являются ключевыми в течение шести месяцев. Стратегические цели в течение шести-двенадцати месяцев включают повышение уровня безопасности, передовое управление и внедрение реагирования на инциденты. Основное внимание уделяется проактивной обороне, с использованием ИИ для приоритизации уязвимостей, охоты за угрозами и автоматизированного реагирования на инциденты, включая использование Gemini для правительства.
CdXz5zHNQW_CtIrww9vHh.jpeg

Руководство разработчика по интеграции Gemini Enterprise и A2UI

Текст представляет A2UI, открытый протокол для создания насыщенных, интерактивных пользовательских интерфейсов в чат-приложениях. Он решает ограничения чат-ботов, которые в основном используют текст, что приводит к неэффективным многоходовым диалогам. A2UI позволяет агентам возвращать компоненты пользовательского интерфейса, описанные в JSON-полезной нагрузке, улучшая пользовательский опыт. Протокол декларативный, потоко-ориентированный и не зависит от фреймворка. Он работает, используя четырехслойный стек, при этом A2UI определяет формат данных или "груз", транспортируемый по конвейеру. Интеграция с Gemini Enterprise (GE) упрощена, потому что GE имеет встроенный рендерер A2UI. Разработчики создают агенты A2A, встраивая компоненты A2UI вместе с инструментами. Затем эти агенты A2A регистрируются в GE в качестве конечных точек. Когда пользователь взаимодействует с виджетом A2UI, GE отправляет взаимодействие обратно агенту в качестве входных данных. Эталонная реализация использует серверную часть ADK для бесшовной интеграции с GE. Агент использует iframe Google Maps Embed для таких компонентов, как GoogleMap. Процесс разработки включает клонирование эталонного репозитория и настройку GE. С помощью A2UI чат-боты могут использовать интерактивные элементы, такие как средства выбора даты, для более плавного взаимодействия с пользователем.
CdXz5zHNQW_EnvqazX08Y.jpeg

От петабайтов к предсказаниям: простые аналитические данные BigQuery в Google Таблицах

Организации часто полагаются на BigQuery как на свой основной источник данных, но ad-hoc анализ часто выполняется в Google Sheets. Перенос данных между этими платформами обычно включает в себя неэффективные методы, такие как экспорт CSV, что приводит к возникновению информационных хранилищ и проблем с безопасностью. Connected Sheets решает эту проблему, обеспечивая прямое, живое соединение между BigQuery и Google Sheets. Это позволяет пользователям анализировать огромные наборы данных в привычном интерфейсе электронных таблиц, не требуя знания SQL. Администраторы данных могут контролировать доступ и поддерживать безопасность, в то время как пользователи получают гибкость и простоту использования с такими функциями, как сводные таблицы и диаграммы. Connected Sheets облегчает самостоятельный анализ, операционную отчетность и гибридное моделирование данных, расширяя возможности пользователей в различных бизнес-функциях. Бизнес-аналитики могут создавать настраиваемые отчеты и информационные панели, используя данные в реальном времени из BigQuery. Настройка проста и требует только учетной записи Google Workspace и проекта Google Cloud с включенным биллингом, доступного либо из Google Sheets, либо из консоли BigQuery. Цель Connected Sheets - предоставить пользователям возможность использовать масштабируемость облака и гибкость электронных таблиц. Это делает доступ к большим наборам данных и работу с ними проще и эффективнее, в конечном итоге передавая данные непосредственно в руки тех, кому они нужны.
CdXz5zHNQW_MrmvTOsjbj.gif

AlloyDB Hot Standby: Более быстрое переключение, стабильная производительность

AlloyDB для PostgreSQL — это полностью управляемая служба баз данных, совместимая с PostgreSQL, разработанная для требовательных корпоративных нужд. Она предлагает исключительную производительность, масштабируемость и доступность, легко интегрируясь с инфраструктурой Google. Основная архитектура высокой доступности (HA) включает в себя активный узел и резервный узел в разных зонах. Традиционно резервный узел был бездействующим, что приводило к потенциальным задержкам во время переключения на резервный узел из-за перезапуска базы данных и прогрева кэша. AlloyDB представляет Hot Standby, меняя роль резервного узла на непрерывную обработку журналов упреждающей записи. Это значительно сокращает время переключения на резервный узел, потому что резервный узел уже работает. Hot Standby также обеспечивает стабильную производительность после переключения на резервный узел, поддерживая теплые кэши памяти для оптимальной скорости. Эта улучшенная доступность и устойчивость предлагаются пользователям AlloyDB без дополнительной платы. Демонстрация подчеркивает более быстрое переключение на резервный узел и немедленное возобновление производительности с Hot Standby. Обновление первоначально доступно в PostgreSQL 18 и скоро будет развернуто в более ранних версиях. SLA AlloyDB 99,99% дополнительно улучшается благодаря этим усовершенствованиям высокой доступности. Hot Standby представляет собой значительный шаг в обеспечении превосходного опыта работы с PostgreSQL.
CdXz5zHNQW_wdPYMX29IR.png

ИИ в SRE: Где и как Google разворачивает агентный ИИ для улучшения операций

Команда SRE Google развивается, чтобы включить в себя ИИ, что обусловлено растущей сложностью систем из-за достижений в области ИИ. Эта инициатива "SRE AI" направлена на использование ИИ для улучшения жизненного цикла разработки программного обеспечения. Возможности интеграции ИИ охватывают различные этапы, включая проектирование надежности и управление инцидентами. Внедряются системы обнаружения аномалий и оповещения на основе ИИ для улучшения времени реагирования и снижения усталости от оповещений. Разрабатываются агенты ИИ для оптимизации расследования инцидентов, коммуникации и процессов посмертного анализа. Команда SRE создает AI Insights для анализа исторических инцидентов и улучшения управления рисками. Ключевые принципы проектирования отдают приоритет прозрачности, безопасности и надежности в работе агентов ИИ. Google SRE AI использует существующую инфраструктуру Google, включая Gemini и Agent Development Kit. Отслеживание уровня автономности помогает оценить истинную автономность систем. Конечная цель - повысить надежность сервисов, снизить эксплуатационные расходы и расширить возможности инженеров. В техническом документе представлена более подробная информация о подходе Google к SRE AI.
CdXz5zHNQW_0GUKjXPWQS.png

Nano Banana 2 и Nano Banana Pro доступны, и уже обеспечивают творческие процессы.

Организации интегрируют ИИ в творческие процессы для создания опыта нового поколения. Новые корпоративные ИИ-модели, Nano Banana 2 и Nano Banana Pro, теперь общедоступны через платформу Gemini Enterprise Agent. Эти модели обеспечивают высококачественную генерацию и редактирование изображений в приложениях и рабочих процессах, поддерживаемые надежной инфраструктурой и безопасностью. Новая функция предварительного просмотра позволяет Nano Banana 2 обрабатывать видеофайлы в качестве входных подсказок, расширяя его мультимодальные возможности. Клиенты используют эти модели для инноваций в различных отраслях. В маркетинге и творческих областях такие компании, как Adobe и WPP, масштабируют индивидуальные кампании и повышают вовлеченность бренда. Ритейлеры, такие как Shopify и URBN, используют эти возможности для создания захватывающих впечатлений от покупок и ускоренной разработки продуктов. Медиа- и развлекательные компании создают рабочие процессы производства нового поколения, обеспечивая режиссерский контроль. Google Cloud предлагает модели и инструменты для создания мультимодальных решений корпоративного масштаба. Разработчики могут получить доступ к этим моделям через Gemini API, с корпоративными соглашениями об уровне обслуживания, доступными для платформы Enterprise Agent.
CdXz5zHNQW_1nWvaoQ9CP.png

Развитие потока данных для обработки огромных наборов данных для машинного обучения

Платформа обработки данных Google, Flume, эволюционировала от MapReduce, чтобы удовлетворить потребности эпохи искусственного интеллекта в обработке огромных объемов данных. Инновации в Flume, теперь доступные в Dataflow Google Cloud, ориентированы на масштабируемость, эффективность и удобство для разработчиков. Для обработки огромных объемов данных Dataflow включает в себя жидкостное шардирование для динамической перебалансировки рабочих единиц и глобальные вычисления для планирования в инфраструктуре Google. Автоматическая оптимизация конвейера снижает накладные расходы за счет объединения операций, а ограничение скорости вызовов внешних API предотвращает перегрузку системы. Тандемные пулы обеспечивают безсерверный удаленный вывод, преодолевая ограничения масштабируемости. Для повышения эффективности Dataflow предлагает гетерогенные пулы рабочих, чтобы сопоставлять рабочие нагрузки с соответствующими ускорителями, такими как TPU. Автомасштабирование с учетом TPU и применение политики рабочего цикла оптимизируют использование TPU, снижая затраты. Взаимозаменяемость TPU гарантирует, что задания будут запланированы на наиболее подходящую версию и местоположение TPU. Удобство для разработчиков повышается за счет гибкости языка благодаря универсальному SDK, поддерживающему несколько языков программирования и SQL. Предоставляется интеграция с ML-фреймворками, такими как JAX, и нативная поддержка оптимизаций LLM. Единая пакетная и потоковая обработка позволяет пользователям использовать один и тот же код как для исторических, так и для оперативных данных. Наблюдаемость через пользовательский интерфейс мониторинга предлагает комплексный контроль и диагностические данные для производственных конвейеров. Расширенные рабочие процессы, такие как выборка, пробный запуск и приостановка/возобновление конвейеров, ускоряют разработку и эксплуатацию. Dataflow предоставляет эти внутренние инновации Google клиентам Google Cloud, позволяя им решать сложные задачи ML-приложений.

Перейдите от обслуживания на уровне ресурсов к обслуживанию на уровне бизнеса в Google Cloud

Управление плановым обслуживанием в растущей облачной среде может быть сложным и фрагментированным. В настоящее время отслеживание обновлений часто требует ручного связывания инфраструктурных ресурсов с поддерживаемыми ими бизнес-сервисами. Google Cloud запускает App-centric maintenance visibility в рамках Unified Maintenance, чтобы упростить этот процесс. Эта новая функция смещает акцент с отдельных ресурсов на бизнес-ориентированное представление обслуживания. Она интегрируется с App Hub, позволяя пользователям видеть события обслуживания в контексте своих приложений. "Приложение" теперь является основным блоком для управления обслуживанием. Ресурсы, зарегистрированные в App Hub, такие как кластеры GKE или виртуальные машины GCE, будут иметь свои графики обслуживания, объединенные в единую панель управления. Это уменьшает ручные усилия для инженеров платформы, устраняя необходимость сопоставления оповещений с владельцами. Это также позволяет быстрее устранять проблемы, сопоставляя проблемы с производительностью с обновлениями инфраструктуры. Цель состоит в том, чтобы обеспечить предсказуемые операции с бизнес-ориентированным пониманием влияния обслуживания на все сервисы. Пользователи с существующими приложениями в Google Cloud могут получить доступ к этим функциям в Cloud Console и обратиться к руководству по настройке.
CdXz5zHNQW_Oyi9ZwouA7.png

Как Университет Центральной Оклахомы использует ИИ для оптимизации анализа сложных уголовных дел

Институт судебной экспертизы Университета Центральной Оклахомы (FSI) в партнерстве с Google разработал решение на основе искусственного интеллекта, направленное на ускорение анализа уголовных дел. Это сотрудничество использует NotebookLM от Google для значительного сокращения времени, необходимого для анализа сложных документов и построения хронологии событий. Проект возник в результате хакатона по искусственному интеллекту, организованного ИТ-директором UCO Соней Уоткинс, с акцентом на выявление эффективных решений на основе ИИ. На хакатоне приоритетом был инструмент анализа хронологии дел с использованием Gemini для генерации идей и оценки воздействия. Первоначальные испытания продемонстрировали существенное сокращение многомесячной нагрузки по анализу дел. Команда UCO, в том числе преподаватели FSI, тщательно следит за тем, чтобы хронологии, созданные ИИ, соответствовали судебно-медицинским стандартам. Они разрабатывают повторяемую структуру, обеспечивающую прямую связь выводов ИИ с исходными документами. Эта структура направлена на национальное внедрение, стандартизируя обработку доказательств для институтов судебной экспертизы и правоохранительных органов. Цель проекта - создать масштабируемое решение, способствующее отправлению правосудия по всей стране. Google предлагает Gemini для образования, чтобы предоставить учреждениям возможности для исследований на основе ИИ.

Объявляем о новом наборе участников акселератора Google для стартапов: Ближний Восток, Северная Африка и Турция.

Google стремится организовать глобальную информацию и поддерживать стартапы, основанные на искусственном интеллекте, особенно в регионе MENA-T. Программа Google for Startups Accelerator способствует инновациям в этой области. Новая группа из 15 компаний начнет программу 1 июня. Эти стартапы получат пользу от наставничества, технической поддержки и ресурсов для навигации по региональным сложностям. Предыдущая группа, завершившаяся в ноябре 2025 года, достигла значительных успехов под руководством экспертов Google. Эти достижения включали в себя доработку бизнес-стратегии и ускорение инициатив в области ИИ/МО. Программа 2026 года предлагает дополнительное внимание к сложным геополитическим условиям. Выбранные компании представляют различные области, используя ИИ для здравоохранения, электронной коммерции, образования и многого другого. Трехмесячная учебная программа предоставляет технические знания, включая безопасность и обучение генеративному дизайну. Программа интегрирует стратегическое бизнес-моделирование, чтобы дать стартапам возможность масштабировать инновации. COGNNA показала существенный рост, закрыв значительный раунд финансирования после улучшений в программе. Smart Bricks также получила финансирование и использовала инструменты ИИ Google для автоматизации инвестиций в недвижимость. Google стремится поддерживать региональных основателей, предоставляя инфраструктуру для непрерывного цифрового роста и инноваций.
CdXz5zHNQW_c6CNjEp6Al.jpeg

Руководство по холодному запуску ИИ в Cloud Run

Текст исследует проблему длительного холодного старта для моделей ИИ в Cloud Run, что расстраивает разработчиков и заставляет некоторых избегать использования серверных GPU. Он подробно описывает четыре фазы холодного старта ИИ: подготовка инфраструктуры, потоковая передача образа контейнера, инициализация движка и загрузка модели. Автор предоставляет лучшие практики, взятые из документации Google Cloud, для улучшения этих холодных стартов. Ключевые стратегии оптимизации включают оптимизацию формата и размера модели, выбор эффективных вариантов хранения, использование ускорения CPU при запуске и настройку прямого выхода из VPC. Автор подчеркивает настройку параллелизма для максимального использования GPU и предотвращения ненужного масштабирования. Дополнительные стратегии предлагают единый "всегда включенный" сервис для глобальных развертываний или использование "вызовов пробуждения" для маскировки холодных стартов. Он также подчеркивает важность настройки проб запуска и приводит примеры из подхода Elastic к управлению несколькими вариантами сервисов. Эти стратегии направлены на то, чтобы превратить инфраструктуру из проблемы в масштабируемое и надежное решение для ИИ. Вывод заключается в том, что оптимизация холодных стартов жизненно важна для перехода ИИ от хобби-проектов к готовым к производству развертываниям.
CdXz5zHNQW_kcXbDOy26t.jpeg

Представляем Google AI Threat Defense, чтобы помочь вам опередить противника.

Киберугрозы быстро развиваются из-за роста ИИ, что требует от организаций адаптации своей защиты. Google запускает AI Threat Defense для борьбы с этими развивающимися угрозами. Основанная на опыте Google в области безопасности, система использует ИИ для автоматизации обнаружения угроз и реагирования на них. Платформа интегрирует Mandiant и Wiz с возможностями Gemini для обеспечения комплексной безопасности. AI Threat Defense фокусируется на подготовке, сканировании и приоритизации, устранении и мониторинге уязвимостей. Основные функции включают автоматическую идентификацию уязвимостей, устранение и непрерывный мониторинг. Система использует ИИ-агенты для активного прогнозирования путей атак и приоритизации угроз для более быстрого исправления. Интегрируя CodeMender, платформа предлагает автоматическую генерацию и тестирование исправлений для ускорения устранения. Она нацелена на значительное сокращение времени устранения и улучшение общей ситуации с безопасностью.
CdXz5zHNQW_5WZTzAxzf8.gif

Как мы развивали глобальные сети и сети центров обработки данных Google для эпохи искусственного интеллекта

Сеть Google значительно эволюционировала, переходя с каждой технологической эпохой, и теперь сталкивается с требованиями искусственного интеллекта. Эпоха ИИ требует огромных вычислительных мощностей и специализированной сети, превосходящей возможности отдельных центров обработки данных. Google стратегически размещает центры обработки данных с использованием устойчивой энергии и использует свою сеть для создания гипервычислительного ресурса. Это требует вертикально интегрированного стека ИИ, от чипов до приложений, поддерживаемого AI Hypercomputer. Основные элементы сети включают внутреннюю структуру, межсайтовое соединение и глобальную сеть. В рамках AI Hypercomputer сеть Virgo обеспечивает огромную пропускную способность, низкую задержку и устойчивость для рабочих нагрузок ИИ. Функции автономной надежности и телеметрия высокого разрешения улучшают сетевые операции и минимизируют простои внутри структуры. Масштабирование рабочих нагрузок ИИ между кампусами требует оптимизации глобальной сети, включая многошардовые сети и Cloud Interconnect, разработанный для ИИ. Глобальная сеть поддерживает вывод ИИ, обеспечивая низкую задержку и высокую доступность за счет обширной инфраструктуры. Эти сетевые инновации напрямую включены в среды Google Cloud, поддерживая рабочие нагрузки ИИ для своих пользователей.
CdXz5zHNQW_t9FVgUkNUQ.jpeg

Новое исследование: Обеспечение безопасности ИИ в браузере является главным приоритетом для ИТ-лидеров

Генеративный ИИ стал распространенным инструментом на рабочем месте, создавая новые проблемы безопасности для ИТ-руководителей. Браузер теперь является основным рабочим пространством, что требует усиления мер безопасности. Недавний отчет Omdia опросил ИТ-специалистов, показав, что безопасность браузера является главным приоритетом для большинства организаций. Использование GenAI широко распространено, и большинство организаций разрешают сотрудникам использовать общедоступные приложения. Это создает новые риски утечки данных и подчеркивает важность защиты ИИ. Угрозы, связанные с браузером, включая фишинг на основе ИИ и утечку данных, являются серьезной проблемой для ИТ-специалистов. Защита приложений GenAI является критически важным вариантом использования при оценке новых решений безопасности. Традиционные сетевые инструменты безопасности часто недостаточны в этой развивающейся среде. Chrome Enterprise предлагает решение, интегрируя безопасность ИИ непосредственно в браузер. Это позволяет организациям обнаруживать и контролировать использование ИИ, применять средства защиты данных и устанавливать политики доступа, учитывающие контекст. Защита браузера теперь имеет решающее значение для защиты организаций на современном рабочем месте, управляемом ИИ.
CdXz5zHNQW_EXfLNFtWW0.png

2 PhaaS 2 Яростных: Эволюция фишинговых сервисов на китайском языке

Китайский фишинг как услуга (PhaaS) быстро развивается, предлагая зрелые сервисы и сложные связи с более широкой криминальной экосистемой. Эти платформы снижают порог входа для киберпреступников, обеспечивая социальную инженерию и кражу учетных данных. Эта экосистема переходит от сбора паролей к перехвату OTP в реальном времени для обхода MFA. Злоумышленники используют цифровые кошельки, превращая украденные данные в токенизированные активы для несанкционированного финансового контроля. В отличие от российских аналогов, китайский PhaaS часто нацелен на широкую общественность и работает открыто. Эти сервисы предлагают обширные вспомогательные услуги, включая продажу персональных данных, хостинг и отмывание денег. Атаки используют RCS и iMessage для зашифрованной доставки и перехвата в реальном времени через панели администрирования. ИИ используется для автоматизации создания фишинговых страниц, что затрудняет обнаружение. Эти платформы поддерживают локализацию как услугу, генерируя локализованный контент для различных международных рынков. YY Lai Yu, тематическое исследование, было сосредоточено на Японии со сложной нацеленностью и мерами защиты от ботов. Постоянное развитие этих платформ подчеркивает необходимость технических средств безопасности, помимо обучения пользователей, таких как FIDO2/WebAuthn.
CdXz5zHNQW_Hrw87qeaFv.png

Эксплуатация KnowledgeDeliver через уязвимость десериализации ViewState

В конце 2025 года Mandiant расследовала компрометацию LMS KnowledgeDeliver из-за критической уязвимости: неаутентифицированное RCE. Уязвимость возникла из-за идентичных, предварительно общих машинных ключей ASP.NET во всех развертываниях. Злоумышленники использовали это для внедрения вредоносного кода, стремясь заразить пользователей через веб-сайт. Поскольку ключи были одинаковыми, компрометация одного экземпляра могла скомпрометировать все. Злоумышленники развернули веб-шелл на основе .NET в памяти под названием BLUEBEAM для поддержания доступа. Они изменили файлы, включая JavaScript, чтобы отображать поддельные предупреждения безопасности и загружать удаленный скрипт. Это привело к заражению рабочих станций пользователей Cobalt Strike BEACON. Для обнаружения таких атак организации должны отслеживать журналы событий приложений (Event ID 1316), подозрительную активность процессов от w3wp.exe и целостность файлов. Мониторинг аномальных строк user-agent также имеет решающее значение. Устранение включает в себя ротацию машинных ключей и ограничение доступа к LMS. Инцидент подчеркивает риски общих секретов в шаблонах развертывания.

План: Как Movix заполняет пробел в стоматологических навыках с помощью специализированного агентного ИИ

Movix разрабатывает решения на основе искусственного интеллекта для производителей стоматологических аппаратов, чтобы удовлетворить растущий спрос и нехватку квалифицированных специалистов. Компания сосредоточена на создании агентных рабочих процессов для улучшения контроля качества и оптимизации процессов, уменьшая дорогостоящие ошибки при производстве элайнеров. Их решение использует пользовательские модели ИИ, построенные на инфраструктуре Google Cloud, для таких задач, как обнаружение дефектов в 3D-сканах. Cloud Run и Compute Engine обеспечивают необходимую масштабируемость и вычислительную мощность для обработки больших объемов данных. Это позволяет Movix интегрироваться с существующими стоматологическими системами через API, обслуживая традиционно консервативный рынок. Их агентный подход автоматизирует ручные задачи, повышая эффективность и сокращая сроки изготовления стоматологических аппаратов. Orthero, компания, использующая их технологию, уже испытывает более быстрый и более последовательный контроль качества. Архитектура Movix построена для обеспечения безопасности и соответствия нормам здравоохранения. Они стремятся разработать несколько агентов ИИ для охвата всего рабочего процесса изготовления стоматологических аппаратов к 2029 году. Movix предлагает гибридное решение, которое включает в себя старые системы, расширяя охват рынка.
CdXz5zHNQW_TOZCcb84ee.jpeg

AI Studio открывает полнофункциональное кодирование с Cloud Run, Firebase и Cloud SQL, кредитная карта не требуется.

Google I/O 2026 объявила об обновлениях интеграции между Google AI Studio и Google Cloud. Новые пользователи могут развернуть до двух полнофункциональных приложений в Google Cloud Starter Tier без необходимости учетной записи для выставления счетов. Эта интеграция расширяет выбор баз данных, предлагая Firestore для нереляционных данных и Cloud SQL для реляционных вариантов. Тесная интеграция с инструментами Google Workspace, такими как Sheets, достигается через Firebase Auth для входа пользователей. Агент ИИ определяет подходящую базу данных, упрощая процесс разработки. Пользователи могут быстро развертывать приложения в Cloud Run, используя Firebase Auth для аутентификации и Firestore или Cloud SQL для хранения данных. Интеграция включает автоматизированную основу данных, позволяющую разработчикам сосредоточиться на приложениях. Интеграция Cloud SQL в AI Studio обеспечивает мгновенное предоставление баз данных PostgreSQL с версией для разработчиков, которая автоматически масштабируется до нуля. При создании приложений агент обнаруживает потребности в хранении данных и предлагает настроить Firestore и Firebase Authentication. Через Firebase Auth приложения могут подключаться к Google Workspace и безопасно получать доступ к данным пользователей.
CdXz5zHNQW_kazS8tBaen.gif

Отправка новых функций в продакшн стала проще с новыми флагами функций в AppLifecycle Manager.

Страх часто возникает перед выпуском новых функций, особенно при ускоренной генерации кода на основе ИИ. Флаги функций предоставляют решение этой проблемы, отделяя развертывание кода от выпуска функций, что обеспечивает более безопасные развертывания. Google запускает AppLifecycle Manager Feature Flags (ALM FF) в качестве общедоступной предварительной версии сервиса, использующего этот принцип. ALM FF повышает скорость разработки, отделяя выпуск функций от развертывания кода, что позволяет осуществлять непрерывное развертывание кода с контролем на уровне функций. Этот сервис облегчает постепенное включение с помощью процентных развертываний и точного таргетинга пользователей с использованием Common Expression Language (CEL). Он позволяет динамически обновлять конфигурации, такие как системные подсказки, без изменений кода или модификации инфраструктуры. ALM FF построен на стандарте OpenFeature, обеспечивая переносимость и лучшие отраслевые практики без зависимостей от Google. Команды теперь могут контролировать выпуски, используя процентные развертывания и точный таргетинг пользователей. Сервис позволяет мгновенно отключать проблемные функции, действуя как быстрый выключатель. AppLifecycle Manager Feature Flags предлагает ценный инструмент для разработки программного обеспечения.
CdXz5zHNQW_qxBigBILUN.png