RSS AWS マシンラーニング ブログ ノート

RSS AWS マシンラーニング ブログ

提供されたURLは、Amazon Web Services (AWS) Machine Learning Blogのものです。このAWSウェブサイトのセクションは、マシンラーニング技術、AWSでそれらを使用する方法、そしてマシンラーニングの実世界での応用とユースケースに関する記事や更新を展示しています。これらのブログは、開発者、科学者、エンジニアが予測分析、自然言語処理、コンピュータービジョンなど、様々なタスクでマシンラーニングをどのように活用するかを理解することを助けることを目的としています。ブログセクションはまた、マシンラーニング分野での新しい興味深いトレンドとそれらをAWSサービスと統合する方法も議論しています。

ノートのスレッド

Amazon SageMaker AI 非同期推論がインラインリクエストペイロードをサポートするようになりました

本日、Amazon SageMaker AI 非同期推論のインラインペイロードサポートを発表します。お客様は、InvokeEndpointAsync API のリクエストボディに直接推論ペイロードを送信できるようになり、各呼び出しの前に Amazon Simple Storage Service (Amazon S3) に入力データをアップロードする必要がなくなりました。

Amazon Quickの自律エージェントで毎日時間を節約しましょう

本日、Quickはさらに強力になります。あなたの代わりに継続的に作業する新しい自律エージェント、最も重要な作業を優先順位付けするのに役立つアクティビティフィード、そしてビジネスが稼働しているすべてのデータソースから単一の質問でインサイトを見つける機能が追加されました。

データとAIエージェントのためのコンテキストインテリジェンスを大規模に

エージェントは、推論できるコンテキストと同じくらいインテリジェントです。現在、そのコンテキストは、データレイク、データウェアハウス、レイクハウス、データベース、ストリーム、そして決して書き留められなかった組織内の知識に散在しています。AIエージェントが行った決定を信頼したいと思いますが、エージェントがコンテキストを持つまでそれは実現できません。信頼できる決定を提供するために必要なコンテキストに安全にアクセスする方法をエージェントに与えたときに何が可能になるかを想像してみてください。だからこそ、AWS Summit New York Cityで、データとAIエージェントにインテリジェンスを大規模に提供する一連のイノベーションを発表します。

Amazon Bedrock AgentCoreの新機能:より広範な知識と継続的な学習を備えたエージェントを構築

本日、エージェントの構築、接続、最適化のためのプラットフォームであるAmazon Bedrock AgentCoreの新機能をご紹介します。本投稿では、これらの機能が各ギャップをどのように埋めるかについて説明します。組織、Web、および有料の知識へのエージェントの接続、チームが本番環境で何がうまくいっていないかを見つけて修正するのを支援すること、そしてエージェントの能力向上に合わせてスケーリングする制御を強制することです。これらを組み合わせることで、より有能なエージェントをより迅速に構築し、スケーラブルな制御で管理し、継続的に改善することができます。
CdXz5zHNQW_QyFj6ifCjy.png

Amazon Bedrock Guardrails InvokeGuardrailChecks APIでエージェント型AIアプリケーションを保護する

本日、Amazon Bedrock Guardrailsの新APIを発表します。このAPIを使用すると、ガードレールリソースを作成することなく、エージェント型AIアプリケーションの任意の時点で個々のセーフガード、またはセーフティチェックと呼ばれるものを適用できます。本投稿では、InvokeGuardrailChecks APIの仕組みと、安全でマルチターンのエージェント型AIアプリケーションを構築するためにそれを使用する方法を説明します。
CdXz5zHNQW_i2rrGSHwhG.png

Amazon SageMaker AIにおけるコンテナキャッシングによるモデルスケーリングの高速化

本日、Amazon SageMaker AI推論向けのコンテナイメージキャッシングを発表できることを嬉しく思います。これは、当社の高速スケーリング最適化ジャーニーにおける次の大きな進歩です。これにより、スケールアウトイベント中の生成AIモデルのエンドツーエンドレイテンシが最大2倍高速化されます。
CdXz5zHNQW_hsyyUSX0at.png

Amazon SageMaker AIでP-EAGLEを用いた投機的デコーディングの並列化

この投稿では、Amazon SageMaker AI内でP-EAGLEを直接使用する方法を説明します。SageMaker JumpStartカタログから互換性のあるモデルを選択し、並列ドラフトの仕様を設定し、生成AIアプリケーションを高速化するための高度に最適化されたリアルタイムSageMaker AIエンドポイントをデプロイする方法を実演します。
CdXz5zHNQW_UFPtYiK9fA.jpeg

Amazon BedrockでGemma 4のモデルをご紹介

本日、Amazon BedrockでGemma 4ファミリーの提供を開始することを発表します。Google DeepMindによって開発され、Apache 2.0ライセンスの下でリリースされたGemma 4は、幅広いデプロイメントシナリオにおいて、パラメータあたりの知能に焦点を当てて設計されたオープンウェイトモデルのファミリーです。このファミリーには、3つのインストラクションチューニング済みバリアントが含まれています:Gemma 4 31B、Gemma 4 26B-A4B、およびGemma 4 E2Bです。これらは、リクエストごとにモデルのパラメータの一部のみがアクティブになる、デンスおよびMixture-of-Experts(MoE)アーキテクチャをカバーしています。これらのバリアントは、組み込みの推論機能、ネイティブな関数呼び出し、およびテキストと画像のクロスモーダル入力を提供します。

AIエージェントの障害検出と根本原因分析(Strands Evalsを使用)

この投稿では、実際のAgentの障害を診断するために検出器関数を呼び出す方法を説明します。構造化された出力の解釈方法を学びます。カテゴリ分けされた障害と信頼度スコア、根本原因と下流の症状を結びつける因果関係の連鎖、そして変更がシステムプロンプトまたはツール定義のどちらに属するかを指定する修正の推奨事項です。また、検出を評価パイプラインに統合して、すべてのテスト実行で自動診断を行う方法も学びます。
CdXz5zHNQW_zY4s5o3hIt.png

Deep AgentsとBedrock AgentCoreでコンテキストリッチなリサーチエージェントを構築する

この記事では、このパターンをエンドツーエンドで示す、競合リサーチエージェントを構築します。このチュートリアルは、エージェントの実行環境を分離する必要があるマルチステップAIワークフローを構築する開発者を対象としています。ノートブックのパート2では、この同じエージェントをAgentCore CLIを使用してBedrock AgentCore Runtimeにデプロイできるため、マネージドでセッション分離されたサービスとして実行できます。
CdXz5zHNQW_1oUW8HUA2M.png

スーパーチャージャー構築:ロケット・クローズがエージェンティックAIでタイトル業務をどのように最適化したか

この記事では、Rocket Close が Strands Agents、大規模言語モデル(LLM)、Amazon Bedrock、Amazon Bedrock Knowledge Bases、Model Context Protocol(MCP)ツールを使用してどのようにソリューションを構築したかを探ります。ソリューションの機能、テクノロジースタックの選定理由、学んだ教訓、そして Rocket Close におけるビジネスへの影響について説明します。
CdXz5zHNQW_LrC3ZbmSJM.png

Amazon Quick および Cisco Webex MCP サーバーで会議準備およびフォローアップアシスタントを構築する

この投稿では、Amazon Quick と Cisco Webex MCP サーバーを使用してカスタム会議準備およびフォローアップアシスタントを構築する方法を示します。単一のプロンプトから、エージェントは今後の Webex 会議を見つけ、以前の会議の要約とトランスクリプトを確認し、関連する Vidcast のハイライトとトランスクリプトのコンテキストを取得します。次に、Webex メッセージスレッドを検索して未解決のフォローアップを見つけ、簡潔な準備概要を作成します。会議後、同じアシスタントが議論を要約し、アクションアイテムを特定できます。また、関連する Vidcast の更新を見つけ、適切な Webex スペース向けのフォローアップメッセージを作成することもできます。
CdXz5zHNQW_fnFiuuxGXr.png

PDFからインサイトへ:AWSの生成AIサービスを用いたインテリジェントドキュメント処理パイプラインのアーキテクチャ

この投稿では、Amazon Bedrockとその機能を利用した、AWS上でのコスト効率が高くスケーラブルなインテリジェントドキュメント処理パイプラインの開発について概説します。BDAはAmazon Bedrock内のマネージドサービスであり、ドキュメントからのインサイト抽出を自動化します。BDAがドキュメントコンテンツを抽出し分析する方法、Amazon Bedrock AgentCore Runtime上でホストされるStrands Agentが専門的な処理タスクを調整する方法、そしてAmazon Bedrock Knowledge Baseが複数のドキュメントにわたるコンテキスト理解を可能にする方法を実証します。これらの機能を統一されたアーキテクチャ内で組み合わせることで、組織は最小限の開発工数でドキュメント処理ワークフローを変革できます。
CdXz5zHNQW_peglu7dJbE.png

内側から外側へ構築:AWS Professional Servicesがいかにして最初にフロンティアチームとなったか

AWS Professional Services (AWS ProServe) は、人工知能 (AI) ツールを既存のプロセスに追加するのではなく、内部から根本的にデリバリー方法を再構築することで、エンゲージメントのタイムラインを数ヶ月から数日に短縮しました。この記事では、AWS ProServe がどのようにフロンティアチームになったのか、それを可能にしたプラクティス、そしてあなたのエンジニアリング組織が私たちの経験から何を学べるのかを共有します。
CdXz5zHNQW_sdUF0T9PNf.png

オンデマンドおよびバッチパイプラインで動的にデータを抽出する

この投稿では、Amazon Bedrock 上のオンデマンド推論とバッチ推論の両方で構成されるインテリジェントドキュメント処理パイプラインを示し、ドキュメント処理時間とコストの柔軟性を実現します。
CdXz5zHNQW_XrAKCcZnY1.png

Agent-EvalKitでAIエージェントを体系的に評価する

Agent-EvalKitは、Claude Code、Kiro CLI、Kilo CodeなどのAIコーディングアシスタントと統合することで、この評価インフラストラクチャを利用可能にするオープンソースツールキット(Apache 2.0)です。この記事では、Strands Agents SDKとAmazon Bedrockで構築された旅行リサーチエージェントを実際の例として使用し、Agent-EvalKitが6つの評価フェーズ全体でどのように機能するかを説明します。
CdXz5zHNQW_dcCuBEtw7C.png

Amazon QuickSightでスパークラインとカスタムソートを活用して、より早くトレンドを特定し、より賢く並べ替えましょう。

本日、Quick Sightダッシュボードをさらに表現豊かでビジネスに沿ったものにする2つの新機能、スパークラインとコントロールのカスタムソートを発表できることを嬉しく思います。この記事では、両方の機能、それらが何であるか、いつ使用するか、そしてそれらをどのように設定するかを、実践的で意思決定準備の整ったダッシュボードにまとめる実世界のシナリオとともに説明します。
CdXz5zHNQW_mwSbD3WsXY.jpeg

Amazon Bedrock データ自動化におけるブループリント抽出精度の最適化

ブループリント命令の最適化は、この課題に直接対処するために抽出命令を自動的に洗練するBDAの機能です。期待される値を持つ3から10個のサンプル文書を提供すると、BDAは数分で精度を向上させるためにブループリント命令を洗練します。数週間ではなく。個別のモデルファインチューニングは不要です。この記事の終わりまでに、精度を向上させるためにブループリントを最適化し、Amazon BedrockコンソールまたはAPIを通じて最適化ワークフローを実行し、サンプルとグラウンドトゥルースを選択するためのベストプラクティスを適用できるようになります。
CdXz5zHNQW_xJtxMVhvUr.png

フロンティアチームがAIネイティブ開発をどのように再発明しているか

フロンティアチームは、AIを単にコーディングを速くするためだけに利用しているわけではありません。彼らはソフトウェアの構築方法を再設計しています。その結果、生産性が4.5倍、場合によっては10倍以上に向上しています。
CdXz5zHNQW_2lVGI3IYn0.png

カーネルの手動チューニングはもうやめよう:Neuron Agentic DevelopmentがAWS Trainiumの最適化を加速する方法

本日、AWS TrainiumおよびAWS Inferentia上で開発を行う開発者向けに、これを可能にするAIエージェントとスキルのコレクションであるNeuron Agentic Development capabilitiesを発表します。本投稿では、Neuron Agentic Development capabilitiesがカーネル開発ワークフローをどのように加速させるかを説明します。
CdXz5zHNQW_lzsvjzjpDd.png

Amazon Bedrock AgentCore を使用したAI搭載機器修理アシスタントの構築

この投稿では、Amazon Bedrock AgentCore を使用して AI 駆動型の機器修理アシスタントを構築します。これにより、農家やフィールド技術者は、自然言語を通じて機器の問題を診断し、必要な部品を特定し、メーカー承認の修理手順にアクセスできるようになります。このソリューションは、Strands Agents SDK を使用した AgentCore Runtime、基盤モデルとしての Amazon Nova 2 Lite、検索拡張生成 (RAG) のための Amazon Bedrock Knowledge Base、および会話の永続性のための AgentCore Memory を使用します。
CdXz5zHNQW_Elx4ZOLlbW.png

Amazon SageMaker AI 上の NVIDIA Isaac Lab を使用したスケールロボット強化学習

この投稿では、Amazon SageMaker AI 上の NVIDIA Isaac Lab を使用して、2 つのコンピューティング オプション、Amazon SageMaker HyperPod および Amazon SageMaker Training Jobs を介して Unitree H1 ヒューマノイドのロボット ポリシーをトレーニングする方法を示します。
CdXz5zHNQW_PPYtY1kXNX.png

ハンズフリー初動損害通知:Strands AgentsとAmazon Bedrock AgentCore Browser Toolを活用したインテリジェントなクレーム受付

この投稿では、ドメイン推論のためにStrands Agents SDKで構築されたエージェントと、ライブポータルインタラクションのためのAmazon Bedrock AgentCore Browser Toolを組み合わせたハンズフリーFNOLインテークシステムを実証します。このアプローチは、反復的な画面作業を排除しながら、人間の専門知識を維持します。
CdXz5zHNQW_KWCJXGCmIL.png

Amazon QuickとNew Relicでエージェンティックなインシデントトリアージアシスタントを構築する

この投稿では、エンジニアリングチームがその原則を、エンジニアリングにおける最も時間的制約のあるワークフローの1つであるインシデントトリアージに適用する方法を示します。Amazon Quickを使用してカスタムインシデントトリアージアシスタントエージェントを構築し、New Relic Model Context Protocol (MCP) ServerおよびAsanaとネイティブ統合を介して応答をオーケストレーションします。単一のプロンプトから、Amazon Quickエージェントはインシデントを調査し、証拠リンク付きの根本原因分析 (RCA) ブリーフをまとめ、引き渡し準備のできた追跡可能なAsanaタスクを作成します。
CdXz5zHNQW_rtLjSHmh5n.png

欧州におけるAIの柔軟性を解き放つ:EUデータ処理とモデルアクセスに向けたクロスリージョン推論ガイド

最新の生成AIモデルへのアクセスと、世界的に需要の高い高性能なアクセラレーテッドコンピューティングを利用するにあたり、AWSのお客様は、セキュリティとプライバシーの要件を満たしながら、複数のAWSリージョンにわたるモデルの可用性と容量を活用するためのツールを必要としています。Amazon Bedrock上のクロスリージョン推論(CRIS)は、複数のリージョンにわたるリクエストを自動的にルーティングすることで、これらのニーズに応えます。
CdXz5zHNQW_pZ99OAWaEx.png

これでラップトップを閉じても安全です:Amazon Bedrock AgentCore でコーディングエージェントをホストする

Amazon Bedrock AgentCore Runtime は、各エージェントセッションに、永続的なワークスペース、Gateway を介した安全なツールアクセス、および組み込みのオブザーバビリティを備えた独自の分離されたマイクロVMを提供します。これにより、Claude Code、Codex、Kiro、および Cursor を、シークレット、ポート、またはファイルシステムを共有することなく並列実行できます。蓋を閉じて、夕食に行き、明日中断したところから再開できます。
CdXz5zHNQW_uKokJHCyNJ.png

より大規模な意思決定:直感が失敗する場所で数学的最適化がいかに貢献するか

この記事では、数理最適化を紹介し、それがより広範なAIのランドスケープにどのように適合するかを説明し、イノベーションセンターが顧客と提携して具体的な成果を上げた実世界の成功事例を紹介します。
CdXz5zHNQW_g4vfM0Uk1D.png

Amazon SageMaker AIとFHEによるエンドツーエンド暗号化ML推論

このブログでは、以前の投稿「Enable fully homomorphic encryption with Amazon SageMaker endpoints for secure, real-time inferencing」で機械学習推論のためのFHEについて議論しましたが、この投稿はさらに一歩進みます。以前の投稿では、SEALという低レベルライブラリを使用して線形回帰アルゴリズムを手作業で作成することにより、FHEベースの推論を「ゼロから」実装する方法を示しました。代わりに、この投稿では、FHEベースの推論専用に構築された高レベルライブラリであるconcrete-mlに基づいた、はるかに柔軟で高レベルなアプローチを示します。これは、いくつかの一般的なモデルタイプを「すぐに使える」状態でサポートしており、有名なMLライブラリであるscikit-learnとAPI互換性もあります。
CdXz5zHNQW_lZRyRwHx6Y.png

Amazon Quick ARNs: クロスアカウント移行とネームスペース権限

この記事では、Amazon Quick ARNsの構造について解説し、それらを扱うための実践的なメンタルモデルを提供します。この記事を読み終える頃には、ARNを見て、それがマイグレーション戦略にとって何を意味するのかをすぐに理解し、権限の問題をより迅速に診断し、マルチテナントアーキテクチャを自信を持って設計できるようになります。
CdXz5zHNQW_KplENPUqkB.png

Amazon Nova Sonic ボイスエージェントを、マイク不要で大規模に評価

この記事では、両方の問題を解決するために私たちが構築したオープンソースフレームワークであるNova Sonic Test Harnessをご紹介します。これは、システムプロンプトとツール構成の調整のための迅速なイテレーションツール(会話を実行し、結果を確認し、調整し、繰り返す)として、また大規模な音声エージェントの品質を検証するための包括的な評価フレームワークとして機能します。Amazon Nova Sonicとの完全なマルチターンの会話を自動的に実行し、LLM-as-judge技術を使用して評価し、モデルの音声出力がテキスト出力と一致しない(音声の幻覚)ケースさえ検出できます。マイクは不要です。
CdXz5zHNQW_EhsiRQ8N28.png

Amazon Bedrock 上でセルフドライビングAIオペレーションを大規模に構築する方法

この投稿では、Amazon Bedrock Ops Alertを紹介します。これは、運用上の問題をプロアクティブに検出し、アラームしきい値を動的に調整し、アラームをカテゴリ別に分類し、コンテキストを認識したサポートケースを自動的に作成し、同じアラームカテゴリの未解決ケースが既にアクティブな場合に重複ケースを防ぐのに役立ち、AI SREチームにコンテキスト化された通知を配信する3層の自動監視ソリューションです。ソリューションアーキテクチャと、独自の環境にデプロイする方法を説明します。
CdXz5zHNQW_3u78FaUwyr.png

DLAMIとDLCにおけるSOCIインデックスを使用したコンテナコールドスタート時間の削減

この投稿では、公開されているディープラーニングAMIおよびコンテナでSOCIを使用する方法、ツールの提供するさまざまなSOCIモードを使用するタイミング、そして今日のワークロードでこのツールを迅速かつ効率的に使用する方法について説明します。
CdXz5zHNQW_akK9rYwhB3.jpeg

Amazon SageMaker AI で SFT と DPO を使用して、エージェントのツール呼び出し精度を向上させる

この投稿では、Supervised Fine-Tuning (SFT) と Direct Preference Optimization (DPO) を組み合わせて、小規模言語モデル (SLM) のツール呼び出し精度を向上させる方法を学びます。例では Amazon SageMaker AI トレーニングジョブを使用しているため、独自のトレーニングインフラストラクチャを管理するのではなく、トレーニングコードに集中できます。また、ツール呼び出し精度を評価し、ベースモデルといくつかのファインチューニングされたバリアントを比較する方法も学びます。これにより、モデルの品質に関するデータに基づいた意思決定を行うことができます。
CdXz5zHNQW_5QDwass9I8.png

Amazon Nova Forge におけるハイパーパラメータ最適化の芸術と科学

ドメイン固有のタスクのためのファインチューニングとは、モデルの一般的な能力を低下させることなく、ある分野でのパフォーマンスを向上させることを意味し、そのバランスを正しく取ることは見た目よりも難しいです。この記事では、データとタスクに合った適切なカスタマイズ戦略の選択から、学習率、バッチサイズ、チェックポインティングなど、結果に最も影響を与えるトレーニングパラメータの設定まで、そのバランスをどのように取るかについて説明します。また、トレーニングの無駄につながる一般的な間違いと、それらを早期に発見する方法についても説明します。これにより、一般的な能力を低下させることなくドメインパフォーマンスを向上させ、回避可能な失敗でコンピューティングリソースを浪費することを避けることができます。最終的には、一般的な能力を低下させることなくドメインパフォーマンスを向上させる方法と、バランスを誤ることによる高価な失敗を回避する方法を理解できるようになります。
CdXz5zHNQW_6gZKeRry2j.png

Amazon Nova 2 Lite によるオブジェクト検出

この記事では、Amazon Nova 2 Lite を使用したオブジェクト検出の実装について説明します。Amazon Bedrock、AWS Lambda、Amazon API Gateway を使用してオブジェクト検出アプリケーションをデプロイする方法を学びます。効果的なプロンプトの作成、構造化された JSON 出力の処理、結果の視覚化についても学びます。製造、農業、物流における実践的な応用を探ります。
CdXz5zHNQW_b6d569sZfw.png

Amazon Bedrock AgentCore を使用して Baz が AI Agent Code Review の精度を向上させた方法

この投稿では、Baz が Amazon Bedrock と Amazon Bedrock AgentCore を使用して Spec Review agent を構築した方法を説明します。アーキテクチャの決定、実装の詳細、およびこれらの AWS サービスを活用してコードレビュープロセスを自動化することで達成されたビジネス成果について説明します。
CdXz5zHNQW_XEQZXdOF8l.jpeg

MCPクライアントを使用したAgentCore Gatewayによるセキュアな認証コードフロー設定の構築

この投稿では、Amazon Bedrock AgentCore Gateway でホストされている MCP サーバーのインバウンド認証メカニズムとして Open Authorization (OAuth) Code flow を実装する方法を説明します。このガイドの終わりまでには、各 AI アシスタントリクエストが、組織の ID プロバイダーから発行された有効なユーザー ID トークンで認証される、本番環境に対応したセットアップが完了します。
CdXz5zHNQW_MicsMBiXMo.jpeg

Amazon Bedrock AgentCore Identity で独自の AWS Secrets Manager シークレットを参照する

本日、AgentCore Identity の AWS Secrets Manager でシークレットを参照する機能が利用可能になったことをお知らせします。これにより、Secrets Manager から事前に設定された独自のシークレットを参照し、その管理方法を完全に制御できるようになります。この機能により、組織の既存のシークレットガバナンスプロセスを AgentCore に拡張できます。資格情報プロバイダーリソースで使用するために、既存の事前に設定された AWS Secrets Manager シークレットを提供できます。暗号化設定、ローテーション、レプリケーション、タグ、リソースポリシーは、Secrets Manager の他のシークレットを管理する場合と同様に、完全に制御できます。同じ AWS リージョン内の別の AWS アカウントからシークレットを選択することもできますが、クロスリージョンシークレット共有はサポートされていません。また、AWS Secrets Manager の外部コネクタを通じて取り込まれたシークレットもサポートされており、サードパーティのシークレットマネージャーとの統合が可能になります。
CdXz5zHNQW_zNtYoCtI6A.png

Amazon Quick を活用した希少がん研究の変革:画期的な発見のための生物医学データベースの統合

この記事では、Amazon Quick Research を使用して、希少がん研究のために生物医学データソースを統合する方法を説明します。このウォークスルーでは、小児肉腫を研究ドメインとして使用し、PubMed およびその他のオープンな生物医学リポジトリから公開されているデータセットを利用します。研究目的の定義、データソースの設定、AI 生成された研究計画のレビュー、調査の実行、および改訂とバージョン管理システムを使用した結果の反復処理といった、エンドツーエンドのワークフローをカバーします。
CdXz5zHNQW_JZ57P7YW9R.jpeg

Amazon Bedrock AgentCore GatewayのMCPサポートの拡張

本番環境でModel Context Protocol (MCP) サーバーをデプロイする際、企業はサーバー間のきめ細かなアクセス制御、どのチームがどのツールを使用しているかの可観測性、データ漏洩に対するセキュリティ保証、そしてすべてを大規模に管理できる集中型の認証情報管理を必要とします。Amazon Bedrock AgentCore Gatewayは、MCPサーバーとそれらを消費するクライアントの間に位置し、認証情報管理、可観測性、およびセキュアな […]
CdXz5zHNQW_0n3Vui2fh6.png

Amazon Bedrock AgentCoreゲートウェイにおけるポリシーとLambdaインターセプターによるセキュアなAIエージェント

この投稿では、レイクハウスデータエージェントを使用して、ポリシーを決定論的なアクセス制御に、Lambdaインターセプターを動的な検証に使用する方法をデモンストレーションします。次に、Lambdaインターセプターとポリシーを組み合わせて、動的な検証と決定論的なアクセス制御の両方を必要とする地理ベースのアクセス制御を実装する方法を示します。
CdXz5zHNQW_DEhVNEvCYo.png

Amazon Bedrock AgentCore payments を使用して、組み込みのガードレールにより安全なエージェントによる支払いを有効にする

この投稿では、エージェント型決済システムを設計する際に生じるいくつかの重要なリスクと、AgentCore決済の機能でそれらにどのように対処するかについて説明します。
CdXz5zHNQW_heIs5lPyL5.png

AgentOps: Amazon Bedrock AgentCore でエージェンティックAIを大規模に運用化

エージェント型AIソリューションを構築する際には、独自の運用上の課題に直面します。エージェントは予測不能な決定を下し、コストは予期せず急増し、非決定論的な障害のデバッグは不可能に思えます。エージェント型AIアプリケーションは、単に事前に決定されたワークフローを実行するだけではありません。それらは推論し、適応し、自律的な決定を下します。そのため、DevOpsプラクティスを適応させる必要があります。そこで登場するのがAgentOpsです。これは、本番環境でAIエージェントをデプロイ、管理、継続的に改善するための運用規律です。
CdXz5zHNQW_8EEvCn1mbX.jpeg

Amazon FSx for LustreとTurboQuantでGPUDirectを使用してLLMモデルのロードを高速化し、コンテキストウィンドウを拡張する

AWS GPUインスタンス上で大規模言語モデル(LLM)のデプロイを繰り返し行う場合、GPU High Bandwidth Memory(HBM)にロードするモデルが大きくなるほど、GPUが推論可能になるまでの待機時間が長くなることに気づいたことでしょう。モデルが数百億パラメータに達し、GPU環境がますます大きくなるにつれて […]
CdXz5zHNQW_9dUbI7TMgW.png

MCPを用いた市場インテリジェンスのためのタイムシリーズデータベースとのAmazon Quick統合

この記事では、KDB-X MCPサーバーとAmazon Quickの統合を用いた実践的な実装を解説します。これにより、トレーダーやアナリストが会話形式の言語で質問し、データセットから実行可能な洞察を得られる方法を示します。この同じ統合パターンは、金融市場分析からIoTセンサー監視、DevOpsパフォーマンスダッシュボードまで、時系列データへのアクセスを簡素化する必要がある様々なドメインに応用できます。
CdXz5zHNQW_bwWPbv6dOf.jpeg

Amazon SageMaker AI LLM推論のための包括的なオブザーバビリティ:GPU利用率からLLM品質まで

この投稿では、Amazon SageMaker AI エンドポイントで提供される LLM の品質と量の両方を包括的に把握できる、Amazon Managed Grafana ダッシュボードを使用した包括的なオブザーバビリティ ソリューションを実証します。
CdXz5zHNQW_aDQHc0cILz.png

Amazon SageMaker AIでのアゼルバイジャン語モデルのトレーニング

アゼルバイジャンの主要な電気通信事業者であるAzercell Telecom LLCは、電気通信のユースケースと顧客向けチャットボットのために、Amazon SageMaker AI上にアゼルバイジャン語の大規模言語モデル(LLM)を構築したいと考えていました。課題は、形態的に豊かな言語で、トレーニングデータが限られており、アゼルバイジャン語での効率的なLLMトレーニングに関する既存の青写真がない状況で、基盤モデル(FM)を適応させることでした。6週間の協力期間中、AzercellはAWS Generative AI Innovation Centerと協力して、Amazon SageMaker AI上に本番稼働可能なフレームワークを確立しました。
CdXz5zHNQW_Xlbsxkeqf3.png