RSS AWS 机器学习博客 笔记

RSS AWS 机器学习博客

提供的 URL 是 Amazon Web Services (AWS) 机器学习博客。该 AWS 网站部分展示了关于机器学习技术的文章和更新、如何使用 AWS 以及机器学习在实际应用和用例中的应用。这些博客旨在帮助开发者、科学家和工程师了解如何利用机器学习来执行各种任务,如预测分析、自然语言处理和计算机视觉等。此博客部分还讨论了机器学习领域中的新兴趋势和如何将其与 AWS 服务集成。

笔记线程

为您的数据和 AI 代理提供可扩展的上下文智能

智能体的智能程度取决于其能够推理的上下文范围。如今,这些上下文分散在数据湖、数据仓库、湖仓一体平台、数据库和流数据中,也存在于尚未被记录下来的机构知识里。您希望信任由 AI 智能体做出的决策,但在智能体获得必要的上下文之前,这无法实现。试想,当我们为智能体提供安全访问其所需上下文的方式,使其能够交付可信决策时,将开启怎样的可能性。正因如此,在 AWS 纽约峰会(AWS Summit New York City)上,我们将宣布一系列创新举措,为您的数据和 AI 智能体规模化提供智能支持。

Amazon Bedrock AgentCore 新增功能:构建具备更广泛知识并支持持续学习的智能体

今天,我们推出了 Amazon Bedrock AgentCore 平台的新功能。该平台用于构建、连接和优化智能体。在本篇博客中,我们将介绍这些功能如何弥合各项差距:将智能体连接到组织知识、网络知识和付费知识;帮助团队发现并修复生产环境中出现的问题;以及实施可扩展的控制措施,以应对智能体日益增强的能力。这些功能共同助力您更快地构建更强大的智能体,通过可扩展的控制措施对其进行治理,并实现持续改进。
CdXz5zHNQW_QyFj6ifCjy.png

使用 Amazon Bedrock Guardrails InvokeGuardrailChecks API 保护您的代理式 AI 应用程序

今天,我们宣布推出与 Amazon Bedrock Guardrails 配合使用的新 API。借助此 API,您可以在构建代理式 AI 应用的任何阶段应用单个防护机制(也称为安全检查),而无需创建 guardrail 资源资源。在本篇博客中,我们将介绍 InvokeGuardrailChecks API 的工作原理,并展示如何利用它构建安全的多轮代理式 AI 应用。
CdXz5zHNQW_i2rrGSHwhG.png

亚马逊Bedrock平台推出Gemma 4系列产品

今天,我们宣布 Gemma 4 系列已在 Amazon Bedrock 上可用。该系列由 Google DeepMind 构建,并采用 Apache 2.0 许可证发布。Gemma 4 是一系列开源权重模型,旨在广泛的部署场景中实现每参数智能最大化。该系列包含三个指令微调变体:Gemma 4 31B、Gemma 4 26B-A4B 和 Gemma 4 E2B。这些变体涵盖稠密架构和混合专家(MoE)架构,其中仅模型参数的一小部分会在每次请求时激活。这些变体内置推理能力、原生函数调用功能,并支持文本和图像的多模态输入。

使用 Strands Evals 进行 AI Agent 故障检测与根本原因分析

在本篇博客中,我们将带您了解如何调用检测函数以诊断真实代理故障。您将学习如何解读其结构化输出:包含置信度的分类故障、将根本原因与下游症状关联起来的因果链,以及指定修改应归属于系统提示还是工具定义的修复建议。您还将学习如何将检测集成到评估流程中,以便在每次测试运行时实现自动化诊断。
CdXz5zHNQW_zY4s5o3hIt.png

使用 Deep Agents 和 Bedrock AgentCore 构建上下文丰富的研究智能体

在本篇博客中,您将构建一个具备竞争力的研究代理,完整演示该模式。本教程面向需要为代理提供隔离执行环境的开发者,帮助其构建多步骤 AI 工作流。在笔记本的第二部分,您可以使用 AgentCore CLI 将此代理部署到 Bedrock AgentCore Runtime,使其作为托管的、会话隔离的服务运行。
CdXz5zHNQW_1oUW8HUA2M.png

构建超级充电器:Rocket Close 如何利用代理 AI 优化标题运营

在本文中,我们探讨 Rocket Close 如何利用 Strands Agents、大语言模型(LLMs)、Amazon Bedrock、Amazon Bedrock Knowledge Bases 以及模型上下文协议(MCP)工具构建解决方案。我们将介绍该解决方案的功能、技术选型 rationale、经验教训,以及其在 Rocket Close 产生的业务影响。
CdXz5zHNQW_LrC3ZbmSJM.png

使用 Amazon Quick 和 Cisco Webex MCP 服务器构建会议准备与跟进助手

本文展示了如何使用 Amazon Quick 和 Cisco Webex MCP 服务器构建自定义会议准备与跟进助手。通过单个提示,该代理可查找即将举行的 Webex 会议,回顾过往会议摘要与转录内容,并提取相关的 Vidcast 亮点及转录上下文。随后,它会在 Webex 消息线程中搜索未解决的跟进事项,并生成简洁的会前简报。会后,同一助手可总结讨论内容并识别待办事项,同时查找相关的 Vidcast 更新,并为正确的 Webex 空间起草跟进消息。
CdXz5zHNQW_fnFiuuxGXr.png

从 PDF 到洞察:利用 AWS 生成式 AI 服务构建智能文档处理流程

本文概述了在 AWS 上构建一种经济高效且可扩展的智能文档处理流程,该流程由 Amazon Bedrock 及其功能驱动。BDA 是 Amazon Bedrock 内的一项托管服务,可自动化从文档中提取洞察。我们展示了 BDA 如何提取并分析文档内容,同时运行在 Amazon Bedrock AgentCore Runtime 上的 Strands Agent 协调专门的加工任务,而 Amazon Bedrock Knowledge Base 则实现跨多个文档的上下文理解。通过在统一架构中整合这些能力,组织可以以最小的开发工作量转变其文档处理工作流。
CdXz5zHNQW_peglu7dJbE.png

由内而外构建:AWS 专业服务如何率先成为前沿团队

AWS 专业服务(AWS ProServe)将交付周期从数月压缩至数天,并非通过在现有流程中叠加人工智能(AI)工具,而是从根本上重构了由内而外的交付方式。在本篇博客中,我们将分享 AWS ProServe 如何成为前沿团队、支撑其发展的实践方法,以及您的工程组织可以从我们的经验中汲取的启示。
CdXz5zHNQW_sdUF0T9PNf.png

使用 Agent-EvalKit 对 AI 代理进行系统化评估

Agent-EvalKit 是一个开源工具包(Apache 2.0 许可),通过与 AI 编程助手(包括 Claude Code、Kiro CLI 和 Kilo Code)集成,使该评估基础设施得以应用。本文将以使用 Strands Agents SDK 和 Amazon Bedrock 构建的旅行研究代理为例,逐步介绍 Agent-EvalKit 在其六个评估阶段中的工作原理。
CdXz5zHNQW_dcCuBEtw7C.png

更快地识别趋势,更智能地排序:解锁 Amazon QuickSight 中的迷你图与自定义排序功能

今天,我们很高兴宣布两项新功能,使 Quick Sight 仪表板更加富有表现力且更贴合业务需求:迷你图(sparklines)和控件自定义排序。在本篇博客中,我们将详细介绍这两项功能,包括其定义、适用场景及配置方法,并通过真实案例展示如何将它们整合到一个实用且可支持决策的仪表板中。
CdXz5zHNQW_mwSbD3WsXY.jpeg

在 Amazon Bedrock Data Automation 中优化蓝图提取准确性

蓝图指令优化是一项 BDA 功能,可自动优化您的提取指令以直接应对这一挑战。您只需提供 3 到 10 份带有预期值的示例文档,BDA 即可在几分钟内(而非数周)优化您的蓝图指令,从而提高准确率,无需进行单独的模型微调。到本文结束时,您将能够优化蓝图以提升准确率,通过 Amazon Bedrock 控制台或 API 运行优化工作流,并掌握选择示例和真值数据的最佳实践。
CdXz5zHNQW_xJtxMVhvUr.png

停止手动调整内核:Neuron 代理式开发如何加速 AWS Trainium 优化

今天,我们宣布推出 Neuron 代理开发功能:这是一组 AI 代理和技能,使在 AWS Trainium 和 AWS Inferentia 上构建应用的开发人员能够实现这一目标。在本篇博客中,我们将解释 Neuron 代理开发功能如何加速内核开发工作流。
CdXz5zHNQW_lzsvjzjpDd.png

使用 Amazon Bedrock AgentCore 构建 AI 驱动的维修设备助手

在本篇博客中,您将构建一个基于 Amazon Bedrock AgentCore 的 AI 赋能设备维修助手,帮助农民和现场技术人员通过自然语言诊断设备故障、识别所需备件,并访问制造商批准的维修程序。该解决方案采用 AgentCore Runtime 与 Strands Agents SDK,以 Amazon Nova 2 Lite 作为基础模型,利用 Amazon Bedrock Knowledge Base 实现检索增强生成(RAG),并借助 AgentCore Memory 实现对话持久化。
CdXz5zHNQW_Elx4ZOLlbW.png

免提首失通知:利用 Strands Agents 与 Amazon Bedrock AgentCore 浏览器工具实现智能理赔受理

在本篇博客中,我们展示了免手持 FNOL 录入系统如何将基于 Strands Agents SDK 构建的代理(用于领域推理)与 Amazon Bedrock AgentCore Browser Tool(用于实时门户交互)相结合。这种方法在保留人类专业知识的同时,消除了重复性的屏幕操作。
CdXz5zHNQW_KWCJXGCmIL.png

使用 Amazon Quick 和 New Relic 构建代理式事件分诊助手

本教程展示工程团队如何将这一原则应用于工程领域中最具时效性的工作流之一:事件分诊。您将使用 Amazon Q 构建一个自定义事件分诊助手代理,该代理通过原生集成编排与 New Relic 模型上下文协议(MCP)服务器及 Asana 的响应。仅需一个提示,Amazon Q 代理即可调查事件,汇编包含证据链接的根本原因分析(RCA)简报,并创建已跟踪的 Asana 任务,以便移交。
CdXz5zHNQW_rtLjSHmh5n.png

解锁欧洲人工智能的灵活性:欧盟数据处理与模型访问的跨区域推理指南

凭借最新一代生成式 AI 模型和高性能加速计算资源(全球需求旺盛),AWS 客户需要工具来充分利用多个 AWS 区域中的模型可用性和容量,同时满足其安全与隐私要求。Amazon Bedrock 上的跨区域推理(Cross-Region Inference, CRIS)可满足这些需求,它可自动将请求路由至多个……
CdXz5zHNQW_pZ99OAWaEx.png

现在可以安全地关闭笔记本电脑了:在 Amazon Bedrock AgentCore 上托管代码代理

Amazon Bedrock AgentCore Runtime 为每个代理会话提供独立的微虚拟机,配备持久化工作区、通过网关实现的安全工具访问以及内置的可观测性——因此您可以并行运行 Claude Code、Codex、Kiro 和 Cursor,而无需共享密钥、端口或文件系统。合上盖子,去享用晚餐,明天再从中断处继续。
CdXz5zHNQW_uKokJHCyNJ.png

使用 Amazon SageMaker AI 和全同态加密(FHE)实现端到端加密的机器学习推理

本博客此前已在文章《使用 Amazon SageMaker 端点启用全同态加密,实现安全、实时推理》中讨论了用于机器学习推理的全同态加密(FHE),但本文将进一步深入。前文展示了如何通过手动构建线性回归算法,利用低级库 SEAL 从零开始实现基于 FHE 的推理。而本文则展示了一种更加灵活且更高级的方法,基于专为 FHE 推理构建的高级库 concrete-ml。该库开箱即支持多种常见模型类型,并且与知名的机器学习库 scikit-learn 的 API 兼容。
CdXz5zHNQW_lZRyRwHx6Y.png

大规模评估您的 Amazon Nova Sonic 语音代理,无需麦克风

在本文中,我们将带您了解 Nova Sonic 测试框架,这是我们为解决上述两个问题而构建的开源框架。它既是一个用于快速迭代以调优系统提示词和工具配置的快速工具(运行对话、查看结果、调整、重复),也是一个全面的评估框架,可用于大规模验证语音代理的质量。该框架可自动运行完整的多轮对话,使用 LLM-as-judge 技术进行评估,甚至能够检测模型音频输出与文本输出不匹配的情况(即音频幻觉)。无需麦克风。
CdXz5zHNQW_EhsiRQ8N28.png

如何在 Amazon Bedrock 上大规模构建自主 AI 运维

在本文中,我们介绍 Amazon Bedrock Ops Alert,这是一种三层自动化监控解决方案,能够主动检测运营问题,动态调整告警阈值,按类别对告警进行分类,自动创建具备上下文感知的支持工单,在已存在未解决的同类告警工单时防止重复创建工单,并向 AI SRE 团队提供具备上下文的告警通知。我们将深入讲解该解决方案的架构,并介绍如何在您的环境中进行部署。
CdXz5zHNQW_3u78FaUwyr.png

在 Amazon SageMaker AI 上利用 SFT 和 DPO 提升智能体的工具调用准确性

在本篇博客中,您将学习如何将监督微调(SFT)与直接偏好优化(DPO)结合使用,以提升小语言模型(SLM)的工具调用准确率。示例采用 Amazon SageMaker AI 训练作业,使您可以专注于训练代码,而无需自行管理训练基础设施。此外,您还将学习如何评估工具调用准确率,并对比基础模型与多个微调变体,从而基于数据做出关于模型质量的决策。
CdXz5zHNQW_5QDwass9I8.png

亚马逊 Nova Forge 上的超参数优化艺术与科学

针对特定领域的微调意味着在提升某一领域性能的同时,不损害模型的通用能力,而要达到这一平衡并非易事。本文将探讨如何驾驭这一平衡:从为数据和任务选择合适的定制策略,到配置对学习结果影响最大的训练参数(如学习率、批次大小和检查点保存)。我们还将介绍导致训练资源浪费的常见错误,以及如何尽早发现这些问题,从而在提升领域性能的同时,避免损害通用能力或因可避免的失败而消耗大量计算资源。到本文结束时,您将掌握如何在提升领域性能的同时不损害通用能力,以及如何避免因平衡不当而导致的昂贵失败。
CdXz5zHNQW_6gZKeRry2j.png

使用 Amazon Nova 2 Lite 进行目标检测

在本篇博客中,我们将介绍如何使用 Amazon Nova 2 Lite 实现目标检测。您将学习如何利用 Amazon Bedrock、AWS Lambda 和 Amazon API Gateway 部署目标检测应用程序,同时掌握如何编写高效提示、处理结构化 JSON 输出以及可视化结果。我们还将探讨在制造、农业和物流领域的实际应用场景。
CdXz5zHNQW_b6d569sZfw.png

使用 AgentCore Gateway 与 MCP 客户端构建安全的认证码流配置

本文演示了如何在托管于 Amazon Bedrock AgentCore Gateway 上的 MCP 服务器上实现开放授权(OAuth)代码流作为入站授权机制。完成本指南后,您将拥有一个生产就绪的配置,其中每个 AI 助手请求均通过您组织身份提供商颁发的有效用户身份令牌进行身份验证。
CdXz5zHNQW_MicsMBiXMo.jpeg

在 Amazon Bedrock AgentCore Identity 中引用您自己的 AWS Secrets Manager 密钥

今天,我们很高兴宣布 AgentCore Identity 现已支持引用 AWS Secrets Manager 中的密钥,使您能够引用自身预先配置的 Secrets Manager 密钥,并完全掌控其管理方式。借助此功能,您可以将组织现有的密钥治理流程扩展至 AgentCore。您可以提供现有的、预先配置的 AWS Secrets Manager 密钥供凭据提供程序资源使用。您对其加密配置、轮换、复制、标签及资源策略拥有完全控制权,管理与 Secrets Manager 中其他密钥的方式一致。此外,您还可以选择同一 AWS 区域内其他 AWS 账户中的密钥,但不支持跨区域密钥共享。此功能还支持通过 AWS Secrets Manager 外部连接器引入的密钥,从而实现与第三方密钥管理系统的集成。
CdXz5zHNQW_zNtYoCtI6A.png

利用 Amazon Quick 变革罕见癌症研究:整合生物医学数据库以实现突破性发现

在本篇博客中,我们将介绍如何使用 Amazon Quick Research 整合生物医学数据源以支持罕见癌症研究。本教程以儿童肉瘤为研究领域,并依托来自 PubMed 及其他开放生物医学存储库的公开数据集。内容涵盖端到端的工作流程:定义研究目标、配置数据源、审查 AI 生成的研究计划、执行调查,以及利用修订和版本控制系统对结果进行迭代优化。
CdXz5zHNQW_JZ57P7YW9R.jpeg

扩展亚马逊 Bedrock AgentCore 网关的 MCP 支持

“在生产环境中部署模型上下文协议(MCP)服务器时,企业需要实现跨服务器的细粒度访问控制、对哪些团队使用哪些工具的可观测性、防止数据泄露的安全保障,以及大规模集中式凭据管理。Amazon Bedrock AgentCore Gateway 位于 MCP 服务器与消费它们的客户端之间,实现了凭据管理、可观测性和安全的……"
CdXz5zHNQW_0n3Vui2fh6.png

在 Amazon Bedrock AgentCore 网关中使用策略和 Lambda 拦截器保护 AI 代理

在本篇博客中,我们使用湖仓数据代理(lakehouse data agent)演示如何利用 Policy 实现确定性访问控制,以及利用 Lambda 拦截器(Lambda interceptors)实现动态验证。随后,我们将展示如何结合 Lambda 拦截器和 Policy,实现基于地理位置的访问控制,该方案同时需要动态验证和确定性访问控制。
CdXz5zHNQW_DEhVNEvCYo.png

AgentOps:借助 Amazon Bedrock AgentCore 规模化落地智能体 AI

在构建代理式 AI 解决方案时,您会面临独特的运营挑战。代理会做出不可预测的决策,成本可能意外飙升,而对非确定性故障的调试似乎无从下手。代理式 AI 应用不仅执行预定的工作流,它们还会进行推理、适应并做出自主决策,因此 DevOps 实践也需要相应调整。这正是 AgentOps 发挥作用的地方——它是用于在生产环境中部署、管理和持续改进 AI 代理的运营学科。
CdXz5zHNQW_8EEvCn1mbX.jpeg

通过 Amazon FSx for Lustre 和 TurboQuant 结合 GPUDirect 技术,加速 LLM 模型加载并扩大上下文窗口。

“如果您正在迭代将大语言模型(LLM)部署到 AWS GPU 实例上,您可能会注意到,随着需要加载到 GPU 高带宽内存(HBM)中的模型规模增大,GPU 准备好进行推理所需的痛苦等待时间也会越长。随着模型参数规模增长至数百亿级别,GPU 环境也日益……"
CdXz5zHNQW_9dUbI7TMgW.png

使用 MCP 将 Amazon Quick 与时间序列数据库集成以进行市场情报分析

在本文中,我们将介绍一种实用实现方案,通过 KDB-X MCP 服务器与 Amazon Quick 的集成,展示交易员和分析人员如何使用对话式语言提出问题,并从数据集中获取可操作的洞察。您可以将相同的集成模式应用于多个领域,从金融市场分析到物联网传感器监控,再到 DevOps 性能仪表板,从而简化对时间序列洞察的访问。
CdXz5zHNQW_bwWPbv6dOf.jpeg

在亚马逊SageMaker AI上训练阿塞拜疆语言模型

Azercell Telecom LLC,阿塞拜疆领先的电信服务提供商,希望在 Amazon SageMaker AI 上构建一个面向电信应用场景及客户交互聊天机器人的阿塞拜疆大型语言模型(LLM)。挑战在于:将基础模型(FMs)适配至形态丰富且训练数据有限的阿塞拜疆语,且当时缺乏阿塞拜疆语高效 LLM 训练的有效蓝图。在为期六周的协作中,Azercell 与 AWS 生成式人工智能创新中心合作,在 Amazon SageMaker AI 上建立了一套可投入生产的框架。
CdXz5zHNQW_Xlbsxkeqf3.png

构建一个嵌入 Amazon SageMaker AI MLflow Apps 的自定义门户

在本篇博客中,您将学习如何构建一个自定义门户,其中嵌入了 SageMaker AI MLflow Apps UI。您将了解 React 前端与 Flask 反向代理相结合的架构模式,该反向代理负责处理 AWS Signature Version 4(SigV4)身份验证;通过 AWS Cloud Development Kit(AWS CDK)部署整个堆栈;验证部署结果;并审查安全注意事项及清理流程。
CdXz5zHNQW_CAGtnLBj8U.png