RSS 云博客 笔记

RSS 云博客

cloud.google.com/blog 是 Google Cloud 的官方博客。它提供了 Google Cloud 产品和服务的新闻、更新和见解,以及云计算行业中的趋势和创新。 博客上有 Google Cloud 的专家、工程师和思想领袖撰写的文章,涵盖了人工智能、机器学习、数据分析、安全等广泛的主题。文章经常包括技术教程、案例研究和最佳实践,使博客成为开发者、IT 专业人士和对 Google Cloud 感兴趣的商业领袖的宝贵资源。 博客组织良好,文章按主题、产品和行业分类。访问者可以浏览最新的文章、搜索特定的主题或订阅博客的 RSS 订阅以跟踪最新的新闻和更新。 博客的一些关键特点包括: - 关于 Google Cloud 产品和服务的深入文章,如 Google Cloud Platform、Google Cloud Storage 和 Google Cloud AI Platform - 如何使用 Google Cloud 服务的技术教程和指南 - 来自 Google Cloud 客户的案例研究和成功故事 - 对行业趋势和创新见解和分析 - Google Cloud 的合作伙伴关系和协作的新闻和更新 - 与 Google Cloud 专家和思想领袖的采访 总之,Google Cloud 博客是任何对云计算、人工智能和相关技术感兴趣的人的宝贵资源。

笔记线程

数据代理中的新功能:加速您的 AI 工作流

通用 AI 代理常因缺乏上下文理解能力及安全顾虑而难以处理企业数据。Google 的代理数据云(Agentic Data Cloud)旨在通过在其运营与分析系统中集成 AI 来解决这一问题。该平台为代理访问实时企业数据提供了具备高准确性与统一治理的框架。新的工具和数据代理正在推出,以提升开发效率和可用性。对话式分析(Conversational Analytics)功能正扩展至 BigQuery、Lakehouse、AlloyDB、Spanner 和 Cloud SQL,以支持自然语言数据交互。Looker 嵌入式对话式分析允许将代理直接集成到自定义应用中。一系列新的数据代理现已可用,可自动化任务并为数据工程师、数据科学家和数据库管理员提供智能支持,涵盖数据工程、数据科学、数据库可观测性及数据库接入等场景。Looker 仪表板代理(Dashboard Agent)以及 Gemini Enterprise 中的对话式分析,为业务用户提供了简化获取数据洞察的途径。Data Agent Kit 和托管 MCP 服务器(Managed MCP Servers)等工具可用于支持开发者与代理生态系统的集成。这些进展赋能组织更安全、高效地利用 AI 代理处理企业数据。
CdXz5zHNQW_wVdRRTFqPl.gif

基于图技术构建可信代理平台:雅虎案例研究

企业正从被动智能转向面向代理式人工智能的主动行动系统。Google Cloud 的代理数据云(Agentic Data Cloud)推动了这一转变,雅虎的卖家代理(Seller Agent)数字媒体投放平台便是例证。雅虎与 Google Cloud 合作构建卖家代理,将原本耗时数周的手动流程转化为可在数秒内执行、受控的敏捷活动。该平台展示了自主系统如何实现速度与问责性的统一。传统工作流程(如高端广告投放活动)效率低下,需要大量人工干预与分析。仅集成大语言模型(LLM)是不够的,除非具备对实时数据和约束条件的确定性理解。可信的代理平台需要确凿的事实来源,以避免错误并确保事实依据。监管机构要求涉及真实预算的 AI 决策具备可解释性,因此必须内置治理与可审计性。运行于 Google Cloud 的雅虎卖家代理是一个面向可解释性与可审计性的多代理系统。其架构包含知识图谱与上下文图谱:知识图谱基于 Spanner Graph,将决策锚定于业务现实;上下文图谱利用 BigQuery Graph,记录每一项行动作为可追溯的凭证以供解释。这一双图谱基础实现了通过知识图谱的快速执行,以及通过上下文图谱的持续审计。该架构为需要可信自主系统的行业提供了蓝图,将决策锚定于业务现实,并构建可审计的记忆。
CdXz5zHNQW_9rehc7XuNW.png

云首席信息安全官视角:指导 AI 威胁防御的 4 个关键经验

Chris Betz,Google Cloud 新任首席信息安全官,分享了在开发 AI 威胁防御过程中总结的四项关键经验。AI 正显著加速漏洞发现,使防御者能够在几分钟内识别数千处缺陷。攻击者正利用 AI 实施复杂攻击,但防御者可结合业务背景,利用类似能力进行应对。针对机器速度级别的威胁,传统的基于人工的防御已不再足够。Google 的 AI 威胁防御框架涵盖准备、扫描、修复和监控四个阶段。准备阶段包括缩小攻击面,并与工程团队协同建立稳健的运营框架。扫描与优先级排序需要由专家主导、AI 辅助的软件供应链分析。优先级调整转向首先处理具有更大影响范围的底层代码。修复阶段聚焦于基于风险的发布、全面跟踪以及构建系统韧性,其中包括刷新、移除或重写开源软件以提升安全性。监控阶段建立持续反馈循环,跟踪修复健康状态,并利用 AI 代理应对未来威胁演变。AI 代理可自动化响应剧本并改进编码实践,而红队演练则对基础设施进行压力测试。该方法确保防御体系持续演进并保持安全。
CdXz5zHNQW_hQrhUBcQRP.png

与中国有关联的威胁行为者针对公共和私人医疗社区,致力于人工智能、网络、医疗及国防研究

一个高度复杂的针对中国关联的威胁行为体 UNC6508 已针对北美地区的学术、医疗和军事研究机构展开活动。该行为体在超过一年的时间内未被发现,其通过入侵 Web 应用程序并部署名为 INFINITERED 的定制恶意软件实施攻击。UNC6508 旨在窃取敏感数据,包括国家安全情报和前沿研究成果。其主要手段是利用存在漏洞的 REDCap 服务器捕获登录凭证。在获取访问权限后,该行为体转向内部系统,并采用新颖的技术进行数据外泄。Google 威胁情报组(GTIG)已破坏恶意基础设施,并通知了受影响的组织。他们建议启用双因素验证并遵循安全最佳实践。INFINITERED 采用模块化架构,包含加载器、凭证窃取器和后门。该恶意软件通过向 REDCap 升级流程注入代码来维持持久化。凭证窃取器捕获登录信息,并将其加密存储于数据库中。后门允许执行命令以实施数据窃取和系统控制。该威胁行为体还操纵了域名内容合规规则,以实现隐蔽的数据外泄。GTIG 与 Mandiant Consulting 及其他 Google 团队合作,提供全面的威胁情报和修复支持。
CdXz5zHNQW_Kt1CMvP0Cs.png

我如何在一天内用 Antigravity 2.0 学会 Go,以及你也可以做到

作者旨在以高性能的 Go CLI 替换资源密集型的 Node.js 工具。他们定义了架构目标,包括零依赖核心、高性能以及零信任安全模型。在权衡 Rust、Python、Zig 和 Swift 等替代方案后,Go 因其功能平衡性被选中。一个 AI 代理协助审计现有代码,并验证不存在直接的 Go 移植版本。项目始于安装一个流行的 Go 代理技能,以确保符合社区标准的编码实践。随后进行差距分析,细化架构目标,并由 AI 代理规划迁移工作。迁移过程涉及将 TypeScript 配置转换为 Go,并映射各类代理目录。用户接入逻辑被隔离到单独的文件中。为确保功能对等,实施了测试驱动开发(TDD)循环:AI 在编写生产代码之前生成测试,首先从前文解析(frontmatter parsing)开始。错误处理与 Go 最佳实践保持一致,确保显式错误检查和上下文包装。单元测试辅以端到端集成测试,以覆盖多种场景。为管理 CLI 命令的庞大范围,利用并行子代理,每个代理专注于单个命令。这种方法有助于发现缺失的选项和测试。采用了“大象与金鱼”架构模式,使用持久协调代理和针对特定任务的瞬态子代理。Go 包结构最终确定,支持原生安装。使用矩阵构建配置了 CI/CD 流水线,以确保跨平台兼容性。尽管迁移至 Go,但流水线仍保留 Node.js 依赖项,用于 GitHub Actions 辅助工具。最终考量包括代码签名,以分发预编译的二进制文件。
CdXz5zHNQW_rpTWrPGL8F.jpeg

介绍开放知识格式

基础模型需要相关的上下文才能有效,尤其是在智能系统中。组织面临着分散在各种系统中的内部知识碎片化的环境。为此,开放知识格式(OKF)作为开放规范被引入。OKF 将 LLM-wiki 模式形式化为可携带、互操作、供应商中立的格式。它将知识表示为带有 YAML 前置的 markdown 文件目录,采用简单的互操作性约定。这种形式允许不同的生产者和代理在不翻译的情况下消费知识。 OKF设计上极少偏见,确保生产者与消费者的独立性,并优先考虑格式而非专有平台。每个概念是一个标记文件,通过文件路径标识,结构字段用 YAML 前页,正文用 markdown 表示。概念通过 markdown 相互连接,形成关系图。参考实现包括丰富代理和静态HTML可视化工具。该形式旨在通过社区贡献不断演变。Google Cloud 的知识目录也会接收 OKF。最终,OKF旨在成为人工智能应用知识交流的通用语。

赋能可信 AI 的下一个时代

Google Cloud 正与 Apple 合作,为其扩展的私有云计算(PCC)系统提供动力。此次合作利用了 Google Cloud 先进的安全与隐私技术。该合作的核心是 Google Cloud 的可信计算组合,其保护数据在整个生命周期中的安全。Titanium 安全架构采用 Titan 芯片,为 Google 的基础设施提供硬件级信任根。可信计算利用可信执行环境(TEEs),即使数据处于使用中状态也能对其进行加密。Apple 的 PCC 依赖这些由 Intel TDX 和 NVIDIA 可信计算驱动的 TEEs。这种基于硬件的隔离为敏感 AI 工作负载提供了高度安全且私有的环境。Google Titan 芯片对于建立 PCC 硬件平台的完整性至关重要。此次合作还包括一个开源主机栈,以增强透明度并对安全属性进行独立验证。这一联合努力构建了一个稳健且可验证的系统,旨在满足 Apple 对 PCC 的严格隐私与安全要求。这些进步将使所有 Google Cloud 客户受益,尤其是那些处理敏感 AI 数据的客户。

借助 Looker Agent,将仪表板转化为交互式数据体验

传统仪表板虽具实用性,但缺乏交互性,且阻碍用户提出后续问题。这往往打乱工作流程,或需依赖数据分析师协助。为此,Looker 推出仪表板代理(Dashboard Agents)预览版,支持直接在仪表板内进行对话式数据探索。用户现可使用自然语言与业务智能数据互动。点击 Gemini 图标即可发起对话并获得上下文相关的洞察。该代理利用已应用过滤器、交叉过滤器及精选图块,提供高度相关的回答。若需更多信息,代理可访问底层 Explore 以获取更深层洞察,并以图表和解释形式呈现。数据分析师可通过提供自然语言指令来定制代理的响应,确保其针对特定受众准确解读业务逻辑。这种自助服务能力有助于分析师团队扩展工作成效。仪表板代理还通过展示其推理过程、引用图块及应用过滤器,确保可信度与透明度。其运行于 Looker 现有治理模型之内,遵循用户权限设置。管理员可在 Looker 26.08.11 及更高版本中,通过 Looker 设置中的 Gemini 启用此功能。
CdXz5zHNQW_yizylgs7nw.gif

ShinyHunters 针对教育行业利用 Oracle PeopleSoft 漏洞发起攻击

Mandiant 与 Google 威胁情报组报告称,UNC6240(又称 ShinyHunters)针对 Oracle PeopleSoft 基础设施发起了一场活跃的勒索活动。攻击者于 2026 年 5 月 27 日至 6 月 9 日期间,利用了 Environment Management 组件中的关键零日远程代码执行漏洞 CVE-2026-35273。Google 已通知超过 100 家组织(主要集中在高等教育领域)其可能遭到入侵。在测试服务器上公开的攻击者目录显示,存在伪装为云端点的定制化 MeshCentral 代理。这些代理被用于部署自定义的横向移动和网页篡改脚本 [victim_abbreviation]_fanout.sh。该活动与 2026 年 6 月 9 日在 ShinyHunters 数据泄露网站上发布的数据泄露直接相关。测试基础设施托管了预配置的 Windows MeshCentral 代理,其伪装成 Microsoft Azure 服务。对命令历史的分析显示,攻击者正在配置测试环境、映射 PeopleSoft 配置,并传播用于横向移动的脚本。该脚本向内部主机喷洒 SSH 凭据,并部署网页篡改标记。建议运行 Oracle PeopleSoft 的组织立即阻止外部网络访问敏感端点,如 /PSEMHUB/hub 和 /PSIGW/HttpListeningConnector。此外,建议审计访问日志以检测可疑的 POST 请求,并监控出站 SMB 流量,作为推荐的安全措施。
CdXz5zHNQW_SKa3xYLQeY.png

我们团队拒绝不使用的 10 个不可或缺提示

经验丰富的构建者不会即兴发挥;他们依赖经过提炼、随时可用的提示,以实现一致的高质量工作。这些提示作为工具,用于降低人类假设的风险,并在编码前对想法进行压力测试。Maja Bilić 使用一个提示来体现一位愤世嫉俗的建筑师,从而细化产品需求并防止过度设计。Andrew Brogdon 利用 AI 处理常被忽视的小部件测试,减少内疚感并提升代码库的可靠性。Aja Hammerly 使用提示查找被遗忘的 TODO 项,并在提交代码审查前清理提交信息。Rich Hyndman 采用一个提示来验证应用权限并识别未使用的权限,这对 Play 商店合规至关重要。Shir Meir Lador 的提示迫使 AI 进行严苛的代码审查,识别关键缺陷而非仅提供礼貌建议。James O'Reilly 使用提示探索权衡取舍,使 AI 保持专注,并将决策权掌握在开发者手中。Emma Twersky 通过提示生成检查清单,以识别 AI 生成代码中的漏洞,防止信任错配。Fred Sauer 通过一系列提示,迭代经历发现、概念验证、评估和细化等阶段。Remigiusz Samborski 将提示嵌入 GitHub Actions,实现自动化的拉取请求审查,让人类审查者专注于更高层级的任务。Karl Weinmeister 利用有向无环图(DAG)分析来提示 AI 进行结构测试,聚焦关键边界并优先改进。这些核心提示将 AI 转化为对抗性思考者,确保开发者以更充分的信心发布产品。

深度解析:Lightning Engine 如何实现 4.9 倍更快的 Apache Spark 性能

Apache Spark 是全球数据处理的核心技术,但数据规模的扩展可能导致性能与成本之间的权衡。代理(agentic)时代并发查询众多,进一步加剧了这些瓶颈,并影响单位经济效益。Managed Service for Apache Spark 现已推出 Lightning Engine,这是一项与现有 Spark 工作负载兼容的性能增强功能。该引擎支持无服务器和托管集群两种部署模式,提供统一的解决方案以加速作业执行。Lightning Engine 已展现出显著的性能提升,速度比标准 Spark 快达 4.9 倍,并相比其他方案提供更优的价格性能比。其核心创新在于向量化原生执行,将 Spark 计划编译为优化的 C++ 指令,从而绕过 JVM 开销。该引擎通过向量化排序、加速窗口函数以及对不支持算子的智能降级机制实现这一目标。此外,Lightning Engine 还优化了云存储和 BigQuery 连接器,以实现更快的数据检索。它具备先进的查询优化功能,如单哈希表缓存和聚合下推。开始使用十分简便,可通过 Google Cloud 控制台或 gcloud CLI 启用 Lightning Engine。此次发布标志着利用 Spark 迎来了新的、更智能且更快的方式。
CdXz5zHNQW_gyIAmWSUK1.jpeg

选择您的运行环境:Antigravity 2.0、Antigravity CLI、Antigravity IDE 或 Antigravity SDK

Antigravity 提供四种不同的接口用于编排自主智能体,所有接口均由统一的底层框架驱动。Antigravity 2.0 是一款桌面应用程序,适用于同时管理多个独立项目中的多项任务,使用户能够在不干扰主工作区的情况下监控和调度工作。对于命令行爱好者和无头执行场景,Antigravity CLI 提供快速、基于终端的体验。希望与智能体直接协作并逐行审查代码变更的开发者会发现 Antigravity IDE 特别有用,它提供集成调试功能和一键修复。Antigravity SDK 是一个 Python 库,使用户能够构建和部署自定义智能体。该 SDK 提供访问 Google 官方 Antigravity 工具所使用的相同工具和规则的权限,支持本地开发并无缝部署至 Google Cloud。所有接口均支持插件和技能,确保无论选择何种界面,均可一致地访问核心逻辑。用户可根据自身工作流程和项目需求选择最合适的工具。更多指导说明和文档可在 antigravity.google 网站获取,下载资源可从专用页面访问。
CdXz5zHNQW_f0XTUFrYdX.png

Claude Fable 5:现已在 Google Cloud 上线”

Claude Fable 5,Anthropic 最新的 frontier 模型,现已在 Google Cloud 上全面可用。此次发布进一步印证了我们持续致力于将业界最新模型直接集成至 Agent Platform 的承诺。 Claude Fable 5 将 Anthropic 模型的最佳能力带给所有客户,并配备强大的 safeguards,确保其适用于通用场景。该模型专为复杂的多步推理而设计,适用于高级软件开发、长周期智能体以及深度多模态文档分析等高要求任务。有关此次发布的更多信息,请访问 Anthropic 官方博客。 即日起,即可在 Agent Platform 上构建基于 Claude Fable 5 及其他 Anthropic 模型(包括 Claude Opus 4.8 和 Claude Sonnet 4.6)的应用。

面向政府的 Gemini:使命影响的蓝图

公共部门正从人工智能实验转向具有实际影响力的应用,亟需超越单一模型的集成化解决方案。Google Cloud 提供统一的 AI 技术栈,以在智能体时代实现这一转型。该技术栈构建于 AI 超算平台之上,专为大规模部署优化,并由 TPU 等先进基础设施驱动。它通过 Google 的前沿模型(包括 Gemini 3.5)以及第三方选项提供智能能力。智能体数据云将 AI 扎根于可信的组织数据,借助跨云数据湖等突破性成果,构建“行动系统”。智能体防御为整个 AI 生命周期提供零信任保护,并由 AI 威胁防御进一步增强。Gemini 企业级智能体平台支持智能体的构建、扩展与治理,并配备 Workspace Intelligence 等预建专用智能体,可立即投入使用。安全至关重要,具备 AI 控制仪表板、智能体注册表和模型装甲等全方位防护机制。Gemini for Government 已获得 FedRAMP High 认证并提供数据隐私保障,新增工具用于保护 AI 生成的代码。通过 Agent Designer 等工具扩展智能体规模,赋能非技术人员通过无代码界面构建智能体。该举措旨在自动化任务、提升生产力,使人员能够专注于关键工作。公共部门团队已从生成式 AI 中显著获益,许多报告称员工生产力至少翻倍。Gemini for Government 为超越试点阶段、迈向可扩展且推动使命达成的应用提供了蓝图。该技术增强了人类能力并加速决策过程。
CdXz5zHNQW_omvR9Ok88T.png

存储洞察数据集:通过活动洞察实现组织范围内的运营发现

AI 工作负载正在将存储从被动仓库转变为主动数据平台。数十亿个非结构化数据对象及其相关操作,要求对数据访问、移动和修改具备更深入的洞察。Google Cloud Storage Insights 数据集现已提供活动洞察,使管理员能够查看 Cloud Storage 资产的运营细节。这些新视图支持数据驱动的成本优化,并加速故障排查。例如,用户可以判断对象是否处于正确的存储类别,或存储桶区域是否布局最优。识别整个存储环境中的运营错误并理解其根本原因变得更加可行。Storage Insights 数据集提供每日元数据和频繁的活动洞察,通常可在四小时内获取。这些洞察以可直接查询的 BigQuery 索引形式交付,取代了手动数据收集。数据集提供对象级活动、存储桶级聚合活动、区域流量以及项目级聚合活动,从而实现对数据生命周期的动态分析,超越静态快照。活动洞察可用于通过识别利用率不足的数据来优化存储规模,并可通过分析区域流量模式来辅助构建全球性能架构。此外,这些洞察有助于厘清并解决运营热点,例如错误代码的突发激增。
CdXz5zHNQW_bsDbZO9A6w.png

如何在软件开发中实现真正的投资回报率(ROI)——深入解读最新的 DORA 研究

为证明生成式 AI 的商业价值,技术与财务领导者必须展示持续融资所需的明确投资回报。成功的关键在于建立实施 AI 所需的组织体系与文化。DORA《AI 辅助软件开发的投资回报率》报告为应对早期采用挑战的团队提供了切实可行的方法。关键发现强调了对 AI 价值实现需保持现实预期的重要性,其价值实现往往呈现 J 型曲线。该 J 型曲线涉及因学习曲线、验证税和流水线适配而导致的暂时性生产力下降。为这一初始学习阶段进行预算规划对于实现持续进展至关重要。报告还揭示了 AI 回报的市场分化现象,组织支持对成功具有重大影响。计算 AI 投资回报率至关重要,应聚焦于软件开发生命周期中的成本降低、生产力提升以及安全性增强等领域。提供交互式投资回报率计算器,可预测 AI 采用的费用与现实情况。领导者可下载完整报告并试用该计算器,以构建具有防御性的 AI 投资商业案例。
CdXz5zHNQW_JeLAU2eN3Q.jpeg

报告:GKE 推理网关可将 AI 响应速度提升高达 92%

生成式 AI 的生产环境对基础设施效率提出了严格要求,而 GKE 推理网关(GKE Inference Gateway)通过智能路由 AI 工作负载提供了解决方案。它超越了基础的负载均衡功能,利用前缀缓存(prefix caching)和模型感知路由(model-aware routing)等高级特性。这确保了请求被定向到已针对该请求预热就绪的加速器上,从而优化硬件利用率并缩短响应时间。独立基准测试显示,GKE 推理网关在吞吐量、首 token 延迟(time to first token)和 token 间延迟(inter-token latency)方面显著优于竞争对手。Snap Inc. 也取得了成功,实现了高前缀缓存命中率并与现有基础设施无缝集成。前缀缓存的工作原理是存储重复提示前缀的激活状态,从而消除冗余的重新处理。这对于使用检索增强生成(retrieval-augmented generation)的文档和代码库问答尤为有用。同样,在多轮对话场景中,缓存系统角色和业务规则可实现持续响应。该技术避免了大语言模型(LLMs)为每个查询重新评估静态上下文的需要。GKE 的卓越性能已在将其与标准托管 Kubernetes 服务进行比较的基准测试报告中得到验证。结果突显了 GKE 在处理速度和延迟方面的显著提升。通过最小化延迟并最大化效率,GKE 推理网关使生成式 AI 应用程序具备生产就绪能力并更具成本效益。
CdXz5zHNQW_Q5fGhEs1eh.jpeg

使用 Google 安全运营代理检测并遏制 AI 驱动威胁

组织正面临日益严峻的由 AI 加速的对手带来的威胁,亟需更快的响应时间。Google AI 威胁防御(Google AI Threat Defense)是一个旨在对抗此类 AI 驱动威胁的自动化系统。该系统基于四步框架运行:准备、扫描与优先级排序、修复和监控。Google 安全运营(Google Security Operations)与 AI 威胁防御协同工作,以监控、检测并响应威胁,特别是涉及无法打补丁代码的威胁。漏洞利用已成为最常见的初始感染向量,且利用行为往往发生在补丁可用之前。Google 安全运营提供了自主隔离整个环境中活跃攻击的运营框架。它通过持续分析、自主调查与响应以及回溯性狩猎,提供跨环境可见性。检测工程代理(Detection Engineering agent)将新的利用模式转化为自定义检测规则,分析多种输入源以识别恶意活动。分类与调查代理(Triage and Investigation agent)自主调查告警,将分析时间从分钟级缩短至秒级。代理自动化(Agentic automation)将 AI 代理与剧本相结合以隔离攻击,使分析师在自动化工作流的同时保持控制。威胁狩猎代理(Threat Hunting agent)支持主动狩猎那些绕过传统防御的隐蔽对手行为和异常。通过集成这些代理,组织能够自主生成检测规则、编排隔离操作,并以机器速度进行威胁狩猎,从而显著降低数据泄露风险与成本。
CdXz5zHNQW_UNHT6iJl7X.png

现代化医疗保健:Alcidion 如何利用 AlloyDB 实现更高的稳定性和性能

Alcidion 是一家智能健康解决方案提供商,旨在降低临床医生的认知负荷,并在恰当时机呈现关键信息。其旗舰平台 Miya Precision 有助于管理患者流程并预防不良事件。此前,Alcidion 在使用 Microsoft SQL Server 的环境中面临性能瓶颈和运营开销问题,特别是在处理复杂 JSON 数据及系统稳定性方面存在挑战。为解决这些问题,Alcidion 将其平台迁移至 Google Cloud 的 AlloyDB for PostgreSQL。 此次迁移利用 Google Cloud 的数据库迁移服务高效完成,核心迁移工作耗时仅略超一周。Alcidion 通过开发自定义同步工具并利用托管的 Google Cloud 服务,实现了仅 15 分钟的切换时间。这一过渡消除了控制平面任务以及与数据库管理相关的行政开销。 成果显著:数据处理时间从 30 分钟缩短至不到 1 分钟,系统稳定性大幅提升,团队得以摆脱对基础设施问题的持续“救火”。此举还减轻了 SRE 团队的行政负担,使其能专注于产品创新。Alcidion 将此次现代化改造视为未来增长的基础步骤,包括探索 AlloyDB 的列式引擎以及集成生成式人工智能。这一战略举措使 Alcidion 能够继续在全球范围内提供更智能、更安全的医疗解决方案。

寻求法律意见:针对美国律师事务所的持续定向行动

由威胁集群 UNC3573 发起的、以财务动机驱动的数据窃取与勒索活动,针对专业、法律及金融服务领域的组织。UNC3573 利用语音钓鱼(vishing)和社会工程学手段获取远程访问权限,常冒充 IT 支持人员。其诱骗受害者共享屏幕并下载远程监控工具,以定位并窃取敏感数据。在某些情况下,威胁行为者甚至获得了对办公室的物理访问权限,伪装成 IT 技术人员,通过 USB 驱动器窃取数据。该活动生命周期极短,在许多案例中,数据窃取与勒索均在单个工作日内完成。初始访问通常通过看似无害、以发票为主题的电子邮件实现,旨在引发安全担忧,随后直接进行语音钓鱼(vishing)呼叫。威胁行为者利用合法工具(如 Zoom、Teams 和远程管理代理 RMM agents),并使用自毁式便签传递命令和链接。他们还滥用自带设备(BYOD)环境作为跳板渗透至企业网络,并针对文档管理系统中的特定敏感文件发起攻击。数据窃取方法包括上传至云存储、使用 FTP 工具,以及指示受害者通过电子邮件发送被盗文件。勒索通信极具攻击性,要求在三天内支付赎金,并威胁将数据公开泄露,同时联系员工和客户。
CdXz5zHNQW_YqBOAUO037.png

Managed Service for Apache Spark 集群的新增功能

Google Cloud 的 Dataproc(现称为 Managed Service for Apache Spark)提供两种部署模式:用于临时任务的无服务器模式,以及用于定制化需求的托管集群。托管集群经过重新设计,专注于提升速度、易用性和智能化水平。一项重大增强是 Lightning Engine,这是一种原生的 C++ 执行引擎,可大幅加速 Spark DataFrame 和 SQL 查询。该引擎在无需修改代码的情况下,性能最高提升 4.9 倍,并实现了更优的价格性能比。新增的灵活虚拟机(Flexible VMs)通过支持按优先级排序的机器类型偏好,提升了集群的弹性。FinOps 功能(如零规模集群和定时停止)为开发环境提供了更优的成本控制。MCP 服务器集成了生成式 AI,使 AI 助手能够使用自然语言与 Spark 集群进行交互以执行操作。Data Agent Kit 使数据科学家能够在其首选的开发环境中管理整个数据工作负载生命周期,并与 Gemini 等工具集成。下一代数据湖仓实现了 Spark 与 BigQuery 之间的无缝互操作性,可直接从云存储甚至远程 AWS 数据集处理数据。Cluster Image 3.0 搭载 Spark 4.1 和 Java 21,引入了实时流处理能力,支持连续、低延迟的数据处理。这些更新现已在 Managed Spark 集群中可用,可通过 Google Cloud 控制台和 gcloud CLI 访问。
CdXz5zHNQW_lTUdK8PnPj.jpeg

扩展 AI 智能体:在 GKE Autopilot 上部署 ADK 的分步指南

本教程将指导您部署 Google Agent Development Kit (ADK) 代理至 Google Kubernetes Engine (GKE) Autopilot。教程首先介绍架构,涉及将 ADK 代理打包为 Docker 镜像并存储于 Artifact Registry,随后在 GKE Autopilot 上运行该代理。代理将通过 Workload Identity 与 Vertex AI 通信,以实现安全的权限管理。前置条件包括 Python、gcloud SDK、kubectl 以及特定 API 的启用。 初始步骤涉及配置您的 Google Cloud 环境,包括身份验证和项目设置。接下来,您需创建 GKE Autopilot 集群,该集群将在后台运行,以便您构建代理。使用 CLI 创建 ADK 代理,并将其配置为使用 Vertex AI 上的 Gemini。在部署之前,通过其 Web UI 在本地测试代理以确保功能正常。 对于部署,您需要将 ADK 代理容器化:创建 Dockerfile 并构建镜像,然后将其推送到 Artifact Registry。接着实施 Workload Identity,通过创建 IAM 服务账号并授予其必要的 Vertex AI 角色来实现。随后创建 Kubernetes 资源,包括一个用于 Workload Identity 的注解服务账号、代理的 Deployment 以及用于内部暴露的 Service。 使用 kubectl 将代理部署到 GKE 并检查其状态。通过向其 API 发送 `curl` 命令演示与已部署代理的交互。可选地,可使用 GKE Gateway API 将代理对外暴露,并配合 Google 托管的 TLS 证书实现安全的 HTTPS 访问。这涉及预留静态 IP、创建 SSL 证书,以及定义 Gateway 和 HTTPRoute 资源。

Serverless 版 Apache Spark 托管服务的新功能

在大规模运行 Apache Spark 需要大量资源及专业管理。Google Cloud 的无服务器 Apache Spark 托管服务(Managed Service for Apache Spark),特别是其 3.0 运行时版本,旨在通过优先保障速度、简洁性和可靠性来简化这一过程。该服务在数据科学领域的客户使用量同比几乎翻倍,显示出其日益增长的采用率。该服务通过零配置入门(zero-setup onboarding)显著缩短了启动工作负载所需的时间,并自动处理权限、网络及 API 管理。敏感工作负载的启动时间已减少 75%,使得无服务器 Spark 适用于更广泛的应用场景。通过动态工作负载调度器(Dynamic Workload Scheduler)的 Flex Start 模式,实现了增强的 GPU 可用性,在 GPU 不可用时对请求进行排队。3.0 运行时为 Apache Spark 4.x 的创新提供一等支持,包括用于解耦连接的 Spark Connect。增强的多区域支持现已作为默认功能,将执行节点分布在区域内的多个可用区,从而在不产生跨可用区流量额外费用的情况下提高可用性。Google Cloud 持续创新,以在自动调优(autotuning)和自动扩缩容(autoscaling)等领域进一步提升易用性。用户可通过在工作负载中指定 runtime_version: 3.0 来开始利用这些功能。
CdXz5zHNQW_FXigucFN3T.jpeg

使用 Google Cloud Storage MCP Server 将 AI 代理与非结构化数据连接

Google Cloud Storage (GCS) 对于代理系统中的非结构化数据至关重要。当前的重点是将这些数据转化为可供代理采取行动的上下文。GCS 中的智能存储通过丰富被动对象,使数据具备代理就绪性。AI 的成功取决于代理能够无缝访问这些智能以进行决策。 本博客介绍了三个由 GCS 驱动的代理客户案例,并解释了如何使用模型上下文协议 (MCP) 安全地连接代理。GCS MCP 服务器结合智能存储功能,简化了代理部署。Palo Alto Networks 的 Strata Co-Pilot 使用 GCS 作为其历史记忆;Airwallex 的 AI 助手利用 GCS 进行文档存储和元数据管理;Snap 的工作优化代理分析 GCS 中的工作数据以发现效率提升点。 MCP 是通用的代理数据标准,GCS 提供远程和本地 MCP 服务器选项。完全托管的远程 MCP 服务器无需基础设施即可提供对 GCS 数据的即时访问,可与主流代理框架集成,并通过 IAM 和审计日志确保稳健的安全性。还可选择集成 Google Cloud Model Armor 以实现高级威胁防护。 自托管的本地 MCP 服务器非常适合构建自定义工具和特定业务逻辑,例如专门的数据转换。它是一个开源选项,可提供更高的自定义能力。GCS 本地 MCP 现已纳入 MCP 数据库工具箱,简化开发并增强安全性。用户可探索远程 MCP 服务器或本地 MCP GitHub 仓库以开始使用。
CdXz5zHNQW_PxY9PQk0UJ.gif

发布 Spanner 图算法:为关联数据提供谷歌级智能

Google Cloud 推出了 Spanner Graph 算法,使用户能够直接在数据库内运行高级图分析。此功能将 Google Research 最先进的图挖掘能力带给 Google Cloud 客户。企业可利用这些新功能,更高效、更快速地从中立数据中获取洞察。图技术正越来越多地应用于欺诈检测、社交网络分析和医疗研究等场景。历史上,大规模运行图算法一直具有挑战性,往往需要复杂的数据管道,或会对事务性能造成影响。Spanner Graph 算法专为处理高需求工作负载而设计,同时不损害操作型数据库的性能。它们与 GQL 实现紧密集成,允许在标准查询的同时直接调用算法,从而最大限度地减少数据移动。算法执行在专用计算资源上进行,确保对实时生产流量产生近乎零的影响。该新引擎可在几分钟内处理具有数十亿条边的海量图,并通过密集数据编码优化性能。Spanner Graph 统一了关系型和图模型,使开发人员能够使用 ISO GQL 查询关联数据。新算法有助于揭示关联数据中的隐藏模式和洞察,例如检测欺诈或推荐产品。关键算法包括中心性(Centrality)、社区发现(Community Detection)以及相似性与路径查找(Similarity and Path Finding)。用户可直接使用 GQL 调用这些算法,并将结果写回 Spanner Graph 或 Cloud Storage。示例展示了如何通过结合社区发现和 PageRank 算法来识别欺诈团伙头目。行业领先企业如 DaVita、Yahoo! 和 SoundCloud 已利用 Spanner Graph 算法应对其复杂的数据挑战。
CdXz5zHNQW_KLmuPh1ZYo.jpeg

加速数据湖:利用 gcs-analytics-core 优化 Apache Iceberg 与 Spark

gcs-analytics-core 是一款新的开源 Java 库,旨在解决数据工程师在使用 Google Cloud Storage(GCS)时,面对多种分析引擎所遭遇的兼容性与性能挑战。该库提供了选择分析引擎的灵活性,同时确保在 GCS 上实现高性能。它为现有的 GCS 分析引擎(如 Iceberg Spark)提供优化,并计划扩展至其他引擎。该库整合并提升了 GCS 上分析工作负载的性能,自 1.11.0 版本起原生集成 Apache Iceberg。它通过在分析引擎与 GCS Java SDK 之间充当集中式优化层,改进列式格式(如 Parquet)的读取操作。关键技术优化包括用于并行数据范围获取的线程化向量化 I/O,以及针对元数据的智能 Parquet 预取。首次重大集成是与 Apache Iceberg:使用其 GCSFileIO 的引擎可自动受益于这些增强。该库兼容所有 Iceberg 目录,在不改变基础设施的前提下提供一致的读取性能提升。基于 Spark 和 Iceberg 的 TPC-DS 基准测试表明,在各种数据集规模下,扫描时间和执行时间均得到显著改善。要开始使用,用户需要 Apache Iceberg Spark 运行时 1.11.0 及以上版本,配置 GCSFileIO,并启用特定的优化标志。该库为开源,托管于 GitHub,并鼓励社区贡献与反馈。
CdXz5zHNQW_mMXNFmmBfk.jpeg

实验 TPU、GKE 托管 DRANET 和多集群推理网关

本博客探讨了在 Google Kubernetes Engine (GKE) 上部署高可用 AI 推理工作负载。目标是利用动态资源分配 (DRA) 和推理网关 (Inference Gateway) 等功能,确保在某个区域发生故障时服务仍可访问。该实验使用 GKE 托管的 DRANET 实现 Pod 间的资源共享,支持跨区域的 TPU 使用。多集群 GKE 推理网关可在多个集群间平衡 AI/ML 工作负载,对于故障切换场景至关重要。Cloud Storage FUSE 提供集中式的模型和日志存储位置,加快部署速度。虚拟私有云 (VPC) 确保通信安全,而 GKE Fleets 统一集群管理。该部署采用 TPU v6e 加速器以实现高性能 AI 计算。设计方案涉及将一个大语言模型部署到两个位于不同区域的 GKE 集群,每个集群均使用四个 TPU v6e 芯片。模型存储于 Cloud Storage,流量通过全球路由进行分发并具备故障切换能力。关键构建组件包括 VPC 和子网配置、防火墙规则以及为网关预留的静态 IP。集群创建时启用了 Gateway API 和 Cloud Storage FUSE CSI 驱动,并配置了专用的 TPU v6e 节点池。在这些节点池上启用托管 DRANET 以实现加速网络。集群注册到 GKE Fleet 以实现统一管理,支持多集群服务发现和入口。AI 工作负载包括将模型权重下载至 Cloud Storage,并部署利用 DRANET 访问 TPU 的推理服务器。多集群推理网关配置了自定义资源定义、自动伸缩指标以及用于统一部署的 InferencePool。最后,网关被配置为将流量路由至最可用的区域,测试证实了在模拟中断期间可无缝切换至次要集群。
CdXz5zHNQW_UvLTnPEClj.png

介绍 GKE 备用缓冲区:在不增加预算的前提下缩短节点启动时间

Google Kubernetes Engine 推出了一项名为“备用缓冲(standby buffers)”的新功能,以解决应用性能与成本之间的权衡。此前,过度配置可确保快速启动,但成本高昂;而最小化成本则会导致冷启动缓慢。GKE 备用缓冲为集群提供了一种低成本、处于挂起状态的容量缓冲。该功能建立在 GKE 活动缓冲(active buffers)之上,后者可提供立即可用的容量以应对流量激增,且启动延迟近乎为零。备用缓冲则维持挂起状态的容量,其成本极低,通常仅为个位数百分比。 与未启用备用缓冲的集群相比,启用该功能的集群在相同流量负载下表现出显著更低的延迟。启用备用缓冲的集群保持了个位数秒级的 P50 延迟,P95 和 P99 指标短暂峰值达到一分钟。传统的 Kubernetes 自动扩缩容速度较慢,需要诸如降低 HPA 阈值或管理气球节点(balloon pods)等变通方案。这些变通方案往往成本高昂且操作复杂。 GKE 活动缓冲和备用缓冲提供了一种声明式的容量管理方式,消除了手动配置的需求。备用缓冲通过挂起计算容量,仅产生持久磁盘和 IP 地址的成本,从而降低基础设施成本。结合活动缓冲,它们能够实现近乎即时的 Pod 调度,性能媲美过度配置,但价格低得多。系统优先从备用缓冲中补充活动缓冲,后者可处理持续负载并防止节点冷启动过慢。备用缓冲的恢复速度是创建全新节点的 2-3 倍,有效弥合了冷启动与始终在线容量之间的差距。该功能使企业能够针对各种工作负载动态平衡性能与成本。
CdXz5zHNQW_8oX6vyeOVS.png

Trustpilot 如何利用 Gemma 构建实时数据增强架构

Trustpilot 每天处理数百万条用户评论,这是一项具有严格延迟和成本约束的复杂任务。他们正将核心人工智能战略转向生成式 AI,并与 Google 合作构建高吞吐量流式处理管道,采用微调后的 Gemma 模型。此举使 Trustpilot 能够从评论中提取深入、可操作的智能信息,执行命名实体识别、分类、情感评分和意图定位等任务。选择微调开源权重模型(如 Gemma)为 Trustpilot 提供了完全的模型独立性、可预测的经济模型以及扩展的 MLOps 能力。他们基于轻量级模型 google/gemma-2-9b 构建了一套专用模型。高质量训练数据集由 Gemini 教师模型生成,并通过分层评论样本的共识标注完成。这些数据集支持微调定制模型,其性能超越传统解决方案,并接近教师模型的准确率。系统架构利用 Dataflow 和 Gemini Enterprise Agent Platform Endpoints,将业务逻辑与原始 LLM 推理解耦以实现可扩展性。性能调优重点在于优化 A2 虚拟机(搭载 A100 GPU)上的 vLLM,并配置 vLLM 后端以支持高吞吐量流式处理。面临的挑战包括私有网络限制、部署可观测性以及欧盟地区的 GPU 资源稀缺。最终,Trustpilot 以极低的成本实现了类 Gemini 的性能,将数百万条评论转化为即时、可操作的洞察。
CdXz5zHNQW_BiOLPvCRmR.png

使用 BigQuery Graph 构建食品供应链的数字孪生模型

扩展连锁餐厅业务面临独特挑战,传统电子表格无法有效应对。这些挑战包括供应链中的牛鞭效应、因标准作业程序(SOP)漂移导致的品牌一致性侵蚀、食品安全问题的广泛影响,以及非合规支出造成的财务损失。为管理此类复杂性,构建企业的数字孪生至关重要。尽管关系型数据库一直是标准方案,但在大规模运营中,其在追踪依赖关系方面的局限性日益显现。BigQuery Graph 提供了解决方案,使用户能够在现有数据平台内构建供应链的数字孪生。这是通过将物理实体(如商品和地点)建模为节点与边构成的网络来实现的。系统通过在现有表上创建图视图来定义语义层,从而展示其相互关系。这种方法将运营从被动问题解决转向主动精准管控,支持精准召回和详细风险分析。图查询简化了复杂的数据分析,使追踪关系和快速获取洞察变得更加容易。为获得最佳效果,应专注于使用图结构关系、通过清洁键确保数据完整性,并在图的边上捕获元数据。最终,BigQuery Graph 使企业能够超越将数据视为简单列表的管理模式,在数秒内可视化关键跨域关系。
CdXz5zHNQW_scvEnWRnwp.png

AlloyDB 的全托管远程 MCP 服务器现已正式发布

AI 代理需要高质量、可访问的上下文才能可靠运行,这些上下文通常存在于运营数据库中。为此,Google Cloud 已发布 AlloyDB 的远程模型上下文协议(MCP)服务器,现已普遍可用。MCP 是一项开源标准,使大语言模型(LLM)能够安全地连接到外部数据源。该集成使 AI 代理能够访问来自 AlloyDB 的实时企业数据,避免因信息过时而导致的不准确。AlloyDB 凭借卓越的向量性能、高级搜索能力以及通过内置 AI 函数提供的实时智能,为代理型应用奠定了坚实基础。它通过允许无缝连接 AlloyDB、BigQuery 和 Iceberg 表中的数据,提供统一的数据访问。AlloyDB 的远程 MCP 服务器运行在托管的 Google Cloud 基础设施上,简化了生产工作负载的连接。其功能包括集中式发现、完全托管的 HTTP 端点,以及使用 Google Cloud IAM 实现的细粒度授权,从而增强安全性。AlloyDB 工具集还赋予代理实例管理操作能力和防止数据外泄的 Model Armor 保护。审计日志提供了所有代理操作的完整轨迹。入门步骤包括 API 准备、数据库配置以及使用远程端点和 IAM 凭据进行代理配置。这使得代理能够通过理解数据库架构并执行复杂查询,提供可靠、有据可依的回答,从而增强企业级代理应用。
CdXz5zHNQW_ZmZ1bXr5CP.gif

云首席信息安全官视角:如何为公共部门构建面向人工智能的安全体系

《云首席信息安全官(CISO)视角》聚焦于为政府和关键基础设施构建面向人工智能的安全体系。Usman Chaudhary 撰写的本文面向 CISO 提供了一条路线图,突出可执行的步骤。该方案的核心在于构建定制化工作流、集成商用人工智能,并将其融入现有安全体系。建议的计划包括为期 90 天的重点聚焦,六个月内设定战术目标,六至十二个月内实现战略目标。这些举措按五个 CISO 工作负载领域进行组织,以实现资源的高效分配并迅速取得成效。即时行动包括争取高层对齐以确立业务合理性、自动化上下文收集以及优化供应商管理。六个月内,威胁情报、标准作业程序(SOP)集成和人才发展是关键任务。六至十二个月内的战略目标包括态势提升、高级治理以及事件响应实施。整体聚焦于主动防御,利用人工智能进行漏洞优先级排序、威胁狩猎及自动化事件响应,其中包括使用 Gemini for Government。
CdXz5zHNQW_CtIrww9vHh.jpeg

Gemini Enterprise 与 A2UI 集成开发者指南

本文介绍了 A2UI,一种用于在聊天应用中构建丰富交互式用户界面的开放协议。它解决了主要依赖文本的聊天机器人在多轮对话中效率低下的问题。A2UI 允许智能体返回以 JSON 负载描述的 UI 组件,从而提升用户体验。该协议具有声明式、支持流式传输且与框架无关的特性。其工作原理是利用四层架构,其中 A2UI 定义了在整个管道中传输的数据格式或“货物”。与 Gemini Enterprise(GE)的集成得以简化,因为 GE 内置了 A2UI 渲染器。开发者构建 A2A 智能体,将 A2UI 组件与工具一同嵌入,随后将这些 A2A 智能体注册为 GE 的端点。当用户与 A2UI 小部件交互时,GE 会将交互结果作为输入返回给智能体。参考实现采用 ADK 后端以实现与 GE 的无缝集成。智能体使用 Google Maps Embed iframe 来渲染如 GoogleMap 等组件。开发流程包括克隆参考仓库并配置 GE。借助 A2UI,聊天机器人可以利用日期选择器等交互式元素,从而提供更流畅的用户体验。
CdXz5zHNQW_EnvqazX08Y.jpeg

从 PB 级数据到预测:在 Google 表格中轻松获取 BigQuery 洞察

组织通常将 BigQuery 作为主要数据源,但临时分析往往在 Google Sheets 中进行。在这两个平台之间传输数据通常涉及低效的方法(如 CSV 导出),从而导致数据孤岛和安全问题。Connected Sheets 通过提供 BigQuery 与 Google Sheets 之间的直接实时连接来解决这一问题。这使得用户能够在熟悉的电子表格界面中分析海量数据集,而无需掌握 SQL 知识。数据管理员可以控制访问权限并维持安全性,同时用户凭借透视表和图表等功能获得敏捷性和易用性。Connected Sheets 支持自助式分析、运营报表和混合数据建模,赋能各业务职能的用户。业务分析师可以构建自定义报表和仪表板,利用来自 BigQuery 的实时数据。设置过程简单,仅需一个 Google Workspace 账户和一个已启用计费的 Google Cloud 项目,可通过 Google Sheets 或 BigQuery 控制台访问。Connected Sheets 的目标是赋能用户充分利用云的可扩展性和电子表格的灵活性。它使访问和处理大型数据集变得更加便捷高效,最终将数据直接交付给需要它的人手中。
CdXz5zHNQW_MrmvTOsjbj.gif

AlloyDB 热备:更快的故障切换,一致的性能

AlloyDB for PostgreSQL 是一项完全托管的数据库服务,与 PostgreSQL 兼容,专为高要求的企业需求而设计。它提供卓越的性能、可扩展性和可用性,并能与 Google 的基础设施无缝集成。其核心高可用(HA)架构包含位于不同区域的活动节点和备用节点。传统上,备用节点处于空闲状态,导致故障切换期间可能因数据库重启和缓存预热而产生延迟。AlloyDB 引入了热备用(Hot Standby)功能,将备用节点的角色转变为持续处理预写日志(WAL)。这显著缩短了故障切换时间,因为备用节点已处于运行状态。热备用还确保故障切换后性能保持一致,通过维持温热的内存缓存实现最佳速度。这些改进的可用性和韧性以零额外成本提供给 AlloyDB 用户。演示展示了热备用带来的更快故障切换以及性能的立即恢复。该功能最初在 PostgreSQL 18 中可用,并将很快推广至早期版本。随着高可用性的这些进步,AlloyDB 99.99% 的服务等级协议(SLA)得到了进一步增强。热备用代表了提供卓越 PostgreSQL 体验的重要一步。
CdXz5zHNQW_wdPYMX29IR.png

SRE 中的 AI:Google 如何及在何处部署代理型 AI 以提升运维效能

Google 的站点可靠性工程(SRE)团队正演进以融入人工智能,这一转变由人工智能发展带来的系统复杂性增加所驱动。该"SRE 人工智能”计划旨在利用人工智能增强软件开发生命周期。人工智能集成的机会涵盖多个阶段,包括可靠性设计与事件管理。正在实施由人工智能驱动的异常检测与告警,以提升响应速度并减少告警疲劳。正在开发人工智能代理以简化事件调查、沟通及事后复盘流程。SRE 团队正在构建“人工智能洞察”功能,用于分析历史事件并改进风险管理。关键设计原则优先确保人工智能代理操作中的透明度、安全性与可靠性。Google SRE 人工智能依托 Google 现有基础设施,包括 Gemini 和代理开发套件(Agent Development Kit)。自主级别跟踪有助于评估系统的真实自主程度。最终目标是提升服务可靠性、降低运营成本并赋能工程师。白皮书提供了关于 Google SRE 人工智能方法的更详细信息。
CdXz5zHNQW_0GUKjXPWQS.png

Nano Banana 2 和 Nano Banana Pro 现已普遍可用,并已投入创意工作流中。

组织正将人工智能整合到创意工作流中,以打造下一代体验。新一代企业级人工智能模型 Nano Banana 2 和 Nano Banana Pro 现已通过 Gemini 企业代理平台普遍可用。这些模型依托稳健的基础设施和安全保障,支持在应用程序和工作流中实现高质量图像生成与编辑。一项新的预览功能允许 Nano Banana 2 将视频文件作为输入提示进行处理,从而扩展其多模态能力。客户正利用这些模型在各行业推动创新。在营销与创意领域,Adobe 和 WPP 等公司正规模化定制营销活动并提升品牌参与度;零售商如 Shopify 和 URBN 则利用这些能力打造沉浸式购物体验并加速产品开发。媒体与娱乐公司正在构建下一代制作工作流,确保导演控制权。Google Cloud 提供构建企业级多模态体验所需的模型与工具。开发者可通过 Gemini API 访问这些模型,企业代理平台还提供企业级服务等级协议(SLA)。
CdXz5zHNQW_1nWvaoQ9CP.png

演进数据流以处理机器学习中的海量数据集

Google 的数据平台 Flume 已从 MapReduce 演进而来,以应对人工智能时代的海量数据处理需求。如今在 Google Cloud 上提供的 Dataflow 中的 Flume 创新,聚焦于可扩展性、效率以及开发者体验。为应对巨大规模,Dataflow 采用液滴分片(liquid sharding)实现动态工作单元重新平衡,并通过全局计算(global compute)在 Google 基础设施范围内进行调度。自动管道优化通过操作融合降低开销,而对外部 API 调用的速率限制则防止系统过载。Tandem 池支持无服务器远程推理,克服了可扩展性限制。 在效率方面,Dataflow 提供异构工作节点池,将工作负载与合适的加速器(如 TPU)相匹配。TPU 感知自动扩缩容和占空比策略执行优化了 TPU 利用率,从而降低成本。TPU 可替代性(fungibility)确保作业被调度至最合适的 TPU 版本和位置。开发者体验通过语言灵活性得到增强,其通用 SDK 支持多种编程语言和 SQL。 Dataflow 集成了 JAX 等机器学习框架,并提供对大语言模型(LLM)优化的原生支持。统一的批处理和流处理功能允许用户使用同一套代码处理历史数据和实时数据。通过监控 UI 提供的可观测性,为生产管道提供全面的控制与诊断数据。高级工作流功能,如采样、试运行以及管道的暂停/恢复,加速了开发与运维。Dataflow 将这些 Google 内部创新带给 Google Cloud 客户,使其能够应对具有挑战性的机器学习应用。

从资源级维护过渡到业务级维护,在 Google Cloud 上

在不断扩展的云环境中管理计划维护可能复杂且碎片化。目前,跟踪更新通常需要手动将基础设施资源与其支持的业务服务关联。Google Cloud 正在 Unified Maintenance 中推出以应用为中心的维护可见性功能,以简化此流程。该新功能将关注点从单个资源转向面向业务的维护视图。它与 App Hub 集成,使用户能够在其应用的上下文中查看维护事件。“应用”现已成为管理维护的主要单元。在 App Hub 中注册的资源(如 GKE 集群或 GCE 虚拟机)的维护计划将在单个仪表板中聚合。这消除了将警报映射到所有者的需求,从而减少了平台工程师的手动工作量。同时,通过将性能问题与基础设施更新进行关联,实现更快的故障排查。目标是提供可预测的运营能力,并基于对跨所有服务维护影响的业务中心理解。已在 Google Cloud 拥有现有应用的用户可在 Cloud Console 中访问这些功能,并查阅指南以完成设置。
CdXz5zHNQW_Oyi9ZwouA7.png

俄克拉荷马中央大学如何利用人工智能简化复杂刑事案件的分析

俄克拉荷马中部大学法医科学研究所(FSI)与谷歌合作,开发了一项人工智能解决方案,旨在加速刑事案件分析。此次合作利用谷歌的 NotebookLM,显著减少了分析复杂文档和构建时间线所需的时间。该项目源于由 UCO 首席信息官索尼娅·沃特金斯(Sonya Watkins)主导的一场人工智能黑客松,聚焦于识别具有影响力的 AI 解决方案。该黑客松优先开发了一款基于 Gemini 进行创意生成和影响力评估的案件时间线分析工具。初步试验表明,该工具大幅减轻了原本耗时数月的案件分析负担。UCO 团队,包括 FSI 讲师,正严谨确保 AI 生成的时间线符合法医标准。他们正在开发一套可重复的框架,确保 AI 得出的结论直接关联至原始源文档。该框架旨在实现全国推广,为法医研究所和执法机构标准化证据处理。项目的目标是打造可扩展的解决方案,助力在全国范围内实现司法公正。谷歌提供 Gemini for Education,赋能机构具备类似的 AI 驱动研究能力。

宣布 Google 初创企业加速器最新一批学员:中东、北非及土耳其

Google 旨在组织全球信息并支持人工智能驱动型初创企业,特别是在 MENA-T 地区。Google for Startups 加速器计划致力于推动该领域的创新。新一期共 15 家初创企业将于 6 月 1 日启动该计划。这些初创企业将获得导师指导、技术支持以及应对区域复杂性的资源。 上一期于 2025 年 11 月结束,在 Google 专家的指导下取得了显著里程碑,包括优化商业战略并加速人工智能/机器学习项目。2026 年计划将额外聚焦于具有挑战性的地缘政治环境。 入选企业涵盖多个领域,利用人工智能服务于医疗保健、电子商务、教育等。为期三个月的课程提供技术专长培训,包括安全与生成式设计。该计划整合战略商业建模,赋能初创企业扩大创新规模。COGNNA 实现了显著增长,在计划优化后完成了一轮重要融资。Smart Bricks 也成功获得融资,并利用 Google 的人工智能工具实现房地产投资自动化。Google 致力于支持区域创始人,为其提供持续数字增长与创新的基础设施。
CdXz5zHNQW_c6CNjEp6Al.jpeg

《云运行中 AI 冷启动指南》

本文探讨了 AI 模型在 Cloud Run 上长冷启动时间的问题,该问题令开发者沮丧,甚至导致部分人回避无服务器 GPU。文章详细阐述了 AI 冷启动的四个阶段:基础设施配置、容器镜像流式传输、引擎初始化以及模型加载。作者基于 Google Cloud 文档提供了最佳实践,以优化这些冷启动过程。关键优化策略包括优化模型格式与大小、选择高效的存储选项、启用启动 CPU 加速,以及配置直接 VPC 出站流量。作者强调通过并发调优来最大化 GPU 利用率,并避免不必要的自动扩缩容。此外,还提出了针对全球部署采用单区域“常开”服务,或利用“唤醒调用”来掩盖冷启动的策略。作者还着重强调了调整启动探测的重要性,并引用 Elastic 管理多种服务变体的案例作为示例。这些策略旨在将基础设施从问题转化为可扩展且可靠的 AI 解决方案。核心结论是:优化冷启动对于将 AI 从爱好级项目推进到生产就绪的部署至关重要。
CdXz5zHNQW_kcXbDOy26t.jpeg

推出 Google AI 威胁防御,助您超越对手

随着人工智能的兴起,网络威胁正迅速演变,迫使组织调整其防御措施。Google 推出 AI 威胁防御(AI Threat Defense),以应对这些不断演变的威胁。该系统基于 Google 的安全专业知识,利用人工智能自动化威胁检测与响应。该平台整合了 Mandiant 和 Wiz,并借助 Gemini 的能力,提供全面的安全防护。AI 威胁防御聚焦于漏洞的准备、扫描与优先级排序、修复及监控。其核心功能包括自动化漏洞识别、修复及持续监控。系统利用 AI 代理主动预测攻击路径并优先处理威胁,从而加快补丁部署。通过集成 CodeMender,该平台提供自动化补丁生成与测试,加速修复进程。其目标是将修复时间显著缩短,并全面提升整体安全态势。
CdXz5zHNQW_5WZTzAxzf8.gif

我们如何为 AI 时代演进 Google 的全球与数据中心网络

Google 的网络已发生显著演变,随每个技术时代而转型,如今正应对人工智能(AI)的需求。AI 时代需要巨大的计算能力和专用网络,其规模已超出单个数据中心的承载能力。Google 战略性地选址于拥有可持续能源的数据中心,并利用其网络构建超计算资源。这需要一个从芯片到应用的垂直集成 AI 堆栈,其基础是 AI 超计算机。网络的核心要素包括内部 fabric、跨站点连接以及全球网络。在 AI 超计算机内部,Virgo 网络为 AI 工作负载提供大规模带宽、低延迟和高韧性。自主可靠性功能和高精度遥测增强了网络运营,并最小化了 fabric 内的停机时间。跨校区扩展 AI 工作负载需要广域网(WAN)优化,包括多分片网络及 AI 原生云互连。全球网络支持 AI 推理,通过广泛的基础设施提供低延迟和高可用性。这些网络创新已直接集成到 Google Cloud 环境中,为其用户的 AI 工作负载提供支持。
CdXz5zHNQW_t9FVgUkNUQ.jpeg

新研究:在浏览器中保障 AI 安全已成为 IT 领导者的首要任务

生成式 AI 已成为职场中的常用工具,为 IT 领导者带来了新的安全挑战。浏览器如今是主要的工作空间,亟需加强安全措施。Omdia 近期的一项报告对 IT 专业人士进行了调查,结果显示浏览器安全是大多数组织的优先事项。生成式 AI 的使用已十分普及,大多数组织允许员工使用公共应用程序,这为数据泄露带来了新的风险,也凸显了保障 AI 安全的重要性。浏览器相关威胁,包括 AI 驱动的钓鱼和数据泄露,是 IT 专业人士的主要关切。在评估新的安全解决方案时,保障生成式 AI 应用程序属于关键用例。传统的基于网络的安全工具在此不断演变的格局中往往不足。Chrome Enterprise 通过将 AI 安全直接集成到浏览器中提供解决方案,使组织能够发现并治理 AI 使用情况,执行数据保护控制措施,并设置上下文感知的访问策略。在现代 AI 驱动的职场中,保障浏览器安全对于保护组织至关重要。
CdXz5zHNQW_EXfLNFtWW0.png

2 PhaaS 2 Furious:中文钓鱼服务的演进”

中文钓鱼即服务(PhaaS)正迅速增长,提供成熟的服务并与更广泛的犯罪生态系统存在复杂关联。这些平台降低了网络犯罪分子的入门门槛,使其能够实施社会工程学攻击和凭证窃取。该生态系统正从密码收集转向实时拦截一次性密码(OTP),以绕过多因素认证(MFA)。攻击者利用数字钱包,将窃取的数据转化为代币化资产,以实现未经授权的金融控制。与俄罗斯同类平台不同,中文 PhaaS 通常针对普通公众,且运作更为公开。这些服务提供广泛的辅助服务,包括个人身份信息(PII)销售、托管和洗钱。攻击利用 RCS 和 iMessage 进行加密投递,并通过管理面板实现实时拦截。人工智能被用于自动化钓鱼页面生成,增加了检测难度。这些平台支持本地化即服务(localization-as-a-service),为多样化的国际市场生成本地化内容。YY Lai Yu 作为一个案例研究,聚焦日本市场,具备复杂的定向策略和反机器人措施。这些平台的持续演进凸显了除用户教育外,还需实施技术安全控制措施,例如 FIDO2/WebAuthn。
CdXz5zHNQW_Hrw87qeaFv.png

知识利用:通过 ViewState 反序列化漏洞进行投递

2025 年末,Mandiant 调查了一起 KnowledgeDeliver LMS 遭入侵事件,其原因为一个关键漏洞:未身份验证的远程代码执行(RCE)。该漏洞源于所有部署中使用了相同的预共享 ASP.NET 机器密钥。攻击者利用此漏洞注入恶意代码,企图通过网站感染用户。由于密钥相同,攻破其中一个实例即可危及所有实例。攻击者部署了一个基于 .NET 的内存型 Webshell,名为 BLUEBEAM,以维持访问权限。他们修改了文件(包括 JavaScript 文件),以显示虚假的安全警报并加载远程脚本。这导致用户工作站感染了 Cobalt Strike BEACON。为检测此类攻击,组织应监控应用程序事件日志(事件 ID 1316)、w3wp.exe 的可疑进程活动以及文件完整性。监控异常的用户代理字符串也至关重要。修复措施包括轮换机器密钥并限制对 LMS 的访问。该事件凸显了部署模板中共享密钥所带来的风险。

蓝图:Movix 如何通过专用代理型人工智能填补牙科技能空白

Movix 正在为牙科矫治器制造商开发基于人工智能的解决方案,以应对日益增长的需求和熟练技工短缺的问题。该公司专注于构建代理工作流,以提升质量控制并优化流程,从而减少矫治器制造中的高成本错误。其解决方案利用构建在 Google Cloud 基础设施上的定制 AI 模型,执行如 3D 扫描缺陷检测等任务。Cloud Run 和 Compute Engine 提供了处理海量数据所需的可扩展性和计算能力。这使得 Movix 能够通过 API 与现有的牙科系统集成,从而服务于传统上较为保守的市场。其代理方法自动化了手动任务,提升了效率并缩短了牙科矫治器的交付周期。采用其技术的 Orthero 公司已在质量控制方面实现了更快且更一致的结果。Movix 的架构设计确保了安全性并符合医疗法规要求。他们计划在 2029 年前开发多个 AI 代理,以覆盖整个牙科矫治器工作流程。Movix 提供混合解决方案,兼容旧有系统,从而扩大市场覆盖范围。
CdXz5zHNQW_TOZCcb84ee.jpeg

AI Studio 借助 Cloud Run、Firebase 和 Cloud SQL 实现全栈 Vibe 编程,无需信用卡。

Google I/O 2026 宣布更新了 Google AI Studio 与 Google Cloud 之间的集成。新用户无需计费账户,即可在 Google Cloud Starter Tier 部署多达两个全栈应用。此次集成扩展了数据库选择,提供用于非关系型数据的 Firestore 和用于关系型数据的 Cloud SQL。通过与 Firebase Auth 实现与 Google Workspace 工具(如 Sheets)的紧密集成,支持用户登录。AI 代理可推断合适的数据库,从而简化开发流程。用户可快速将应用部署至 Cloud Run,使用 Firebase Auth 进行身份验证,并采用 Firestore 或 Cloud SQL 进行数据存储。该集成包含自动化数据基础架构,使开发者能够专注于应用开发。AI Studio 的 Cloud SQL 集成提供 PostgreSQL 数据库的即时配置,并具备开发者版,可自动缩容至零。在构建应用时,代理会检测数据存储需求,并提供设置 Firestore 和 Firebase Authentication 的选项。通过 Firebase Auth,应用可连接至 Google Workspace 并安全访问用户数据。
CdXz5zHNQW_kazS8tBaen.gif

借助 AppLifecycle Manager 中的新功能标志,将功能发布到生产环境变得更加轻松。

在发布新功能时,恐惧感往往随之而来,尤其是随着加速的 AI 驱动代码生成而加剧。特性开关为此提供了解决方案,通过将代码部署与功能发布分离,实现更安全的发布。Google 正在推出 AppLifecycle Manager 特性开关(ALM FF)作为公开预览服务,采用这一原则。ALM FF 通过解耦功能发布与代码部署来提升开发速度,支持在持续代码部署的同时进行功能级控制。该服务支持基于百分比的渐进式启用,并利用通用表达式语言(CEL)实现精确的用户 targeting。它允许在不修改代码或基础设施的情况下动态更新配置,例如系统提示。ALM FF 基于 OpenFeature 标准构建,确保可移植性和行业最佳实践,且无 Google 特定依赖。团队现在可以使用百分比发布和精确用户 targeting 来控制发布。该服务支持即时禁用有问题的功能,充当快速“紧急停止”开关。AppLifecycle Manager 特性开关为软件开发提供了有价值的工具。
CdXz5zHNQW_qxBigBILUN.png