RSS Google Developers Blog フォロー Developers.googleblog.comは、Googleからの公式デベロッパーブログです。ここでは、Googleが提供する様々なデベロッパーツールとその機能、バグフィックス、開発スキル向上のためのチュートリアルに関する包括的な情報を提供します。このブログはまた、Googleのソフトウェア開発プロジェクトに関するケーススタディ、インタビュー、コミュニティーニュースも掲載しています。 RSS developers.googleblog.com Google Developers Blog developers.googleblog.com
ジュールズと共に大切なものを測る AIコーディングエージェントは、プロンプトに応じてタスクを完了する受動的なアシスタントから、急速に変化しています。 Measuring What Matters with Jules developers.googleblog.com
GoogleのAgent Development KitとA2Aでクロス言語マルチエージェントチームを構築する PythonエージェントとGoエージェントがAgent2Agentプロトコルを使用して契約コンプライアンスを共同で実行する方法 Build Cross-Language Multi-Agent Team with Google’s Agent Development Kit and A2A developers.googleblog.com
A2Aが協調型エージェントの世界を構築する方法 エージェント・ツー・エージェント(A2A)プロトコルの1周年を記念する本ブログ記事では、このフレームワークが、従来のAPIの厳格さなしに、自律的なAIエージェントが安全に協力し、タスクを引き継ぐことを可能にする方法を強調します。複雑なワークフローを専門的なピアエージェントに委任することで、A2Aはコンテキストの汚染を防ぎ、データのプライバシーを確保し、モジュール性を通じてアプリケーション設計を簡素化します。このエコシステムを実証するために、本記事では、複雑なタンパク質構造予測を調整するライフサイエンス向けのエージェンティックインターフェースであるFoldRunに焦点を当て、さらに、コマース、データストリーミング、DevOps、電気通信にわたる多様なA2Aユースケースを紹介します。 How A2A is Building a World of Collaborative Agents developers.googleblog.com
A2UI + MCP アプリ:宣言型とカスタムエージェントUIのベストを組み合わせる この投稿では、Model Context Protocol (MCP) アプリと Agent-to-User Interface (A2UI) を統合するために設計された 3 つのアーキテクチャパターンを紹介し、高度にカスタマイズされた iframe 環境とネイティブな宣言的レンダリングとの間のトレードオフを解決します。これらのアプローチを組み合わせることで、開発者は MCP サーバー経由でネイティブな感覚の UI を直接提供したり、宣言的なビュー内に複雑でステートフルな iframe アプリを安全に埋め込んだり、レガシーシステムに生成 UI コンポーネントを注入したりできます。最終的に、これらのハイブリッドフレームワークは、エンジニアリングチームが、特定のプロジェクトの制約に合わせて調整された、安全でパフォーマンスが高く、ブランドの一貫性のあるエージェンティックなユーザーエクスペリエンスを提供できるようにします。 A2UI + MCP Apps: Combining the best of declarative and custom agentic UIs developers.googleblog.com
エージェンティック・リソース・ディスカバリ仕様を発表 ウェブ全体でツール、スキル、エージェントを見つけて検証するためのオープン仕様。エージェントは... Announcing the Agentic Resource Discovery specification developers.googleblog.com
TPUスタックの力を解き放つ:新しいデベロッパーハブのご紹介 Googleは、モデルビルダーや開発者がGoogle Cloud TPUのパフォーマンスを最大限に引き出すことを支援するために設計された、一元化された教育リソースであるTPUデベロッパーハブを正式にローンチしました。このハブは、コードファーストのリソース、オープンソースのレシピ、そしてハードウェアアーキテクチャ、ソフトウェア最適化、デバッグ、並列処理、ネットワーキングを網羅する詳細なドキュメントを提供します。これらの資料は、大規模なトレーニングから低レイテンシの推論ワークロードまで、あらゆるものを効率化するために、人間の開発者とAI支援ツールの両方に合わせて調整されています。 Unlocking the Power of the TPU Stack: Introducing our new Developer Hub developers.googleblog.com
セキュリティと信頼性の向上:Googleでサインインする際の新しいセッションメタデータ Googleは、Sign in with Googleを強化し、新しいOIDC標準クレーム(具体的にはauth_timeとamr(Authentication Methods Reference))を導入することで、開発者にセッションメタデータに関するより深い情報を提供します。これらのアップデートにより、検証済みのアプリはユーザーログインの「鮮度」と使用された認証方法(MFAやハードウェアキーなど)を検証できるようになり、より動的でリスクベースのアクセス制御が可能になります。これらのフェデレーテッドIDシグナルを活用することで、プラットフォームはアカウント乗っ取りや不正行為をより効果的に防止しつつ、機密性の高い操作に対するステップアップ認証のようなきめ細かなセキュリティポリシーを実装できます。 Enhance Security and Trust: New Session Metadata in Sign in with Google developers.googleblog.com
DiffusionGemma: 開発者ガイド DiffusionGemmaは、Gemma 4アーキテクチャ上に構築された実験的なテキスト生成モデルであり、トークンごとの自己回帰ではなく拡散ベースの並列生成を使用しています。これにより、推論速度が大幅に向上し、双方向のコンテキスト認識とリアルタイムの自己修正が可能になり、コンシューマーGPUでのデプロイも可能になります。そのアーキテクチャは、反復的なノイズ除去を通じて256トークンのブロックを並列に生成および洗練するため、従来の言語モデルよりもSudokuのような複雑な制約ベースのタスクをより効果的に処理でき、ファインチューニングからの大幅な改善を示しています。このモデルはvLLMおよびその他の一般的な推論フレームワークと統合されており、開発者は高いパフォーマンス、効率的な長文コンテキストスケーリング、および簡単なカスタマイズとデプロイメントを組み合わせた新しい非自己回帰アプローチにアクセスできます。 DiffusionGemma: The Developer Guide developers.googleblog.com
Google Colab CLIのご紹介 Googleは、開発者やAIエージェントがローカルターミナルをリモートColabランタイムに接続し、シームレスな実行を可能にする新しいツール、Google Colab Command-Line Interface (CLI)を発表しました。この軽量CLIにより、ユーザーは高出力GPUを簡単にリクエストしたり、ローカルPythonスクリプトをリモートで実行したり、ファインチューニングされたGemma 3アダプターのようなアーティファクトログやモデルをシームレスに取得したりできます。標準的なターミナル環境に直接統合されることで、このツールは高度にプログラム可能であり、AntigravityやClaude CodeのようなAIエージェントが複雑な機械学習パイプラインを管理するために使用できるようになります。 Introducing the Google Colab CLI developers.googleblog.com
ラップトップでGemma 4 12Bを動かす:Google AI Edgeによるローカル、エージェント型ワークフローの解放 Google DeepMindのGemma 4 12Bモデルは、16GBのRAMを搭載した一般的なラップトップにエージェント型、マルチモーダルAI機能をもたらし、ローカルデータ処理と視覚的な洞察生成を可能にします。ユーザーは、Google AI Edge Galleryを通じてmacOS上でこのモデルを活用し、動的なPythonコード実行と視覚化を行うことができます。また、Google AI Edge Eloquentを通じて、完全にオフラインでの音声ディクテーションとテキスト編集も可能です。さらに、LiteRT-LM CLIの新しいserveコマンドにより、開発者のワークフローが強化され、業界互換のローカルエンドポイントが作成され、完全にローカルなAIツールとエージェントを強化します。 Bringing Gemma 4 12B to your Laptop: Unlocking Local, Agentic Workflows with Google AI Edge developers.googleblog.com
Gemma 4 12B: 開発者ガイド 新しくリリースされたGemma 4 12Bは、コンシューマーデバイスでの高性能なローカルAI実行のために設計された、密なマルチモーダルモデルです。新しいエンコーダーフリーアーキテクチャを導入することで、従来のビジュアルおよびオーディオエンコーダーをバイパスし、マルチモーダルデータを直接LLMバックボーンに供給します。 Gemma 4 12B: The Developer Guide developers.googleblog.com
コミュニティがTunixとTPUでGemmaに「思考」を訓練した方法 Kaggleで開催されたGoogle Tunix Hackathonは、開発者に対し、Kaggle TPUと限られたコンピューティング予算を使用して、小規模で推論能力のないベースモデルを汎用的な推論エンジンに変革することを課題としました。優勝チームは、Supervised Fine-Tuning(SFT)とGRPOやSimPOのような高度なアライメント技術を組み合わせたマルチステージのポストトレーニングパイプラインを実装することで、これを達成しました。最終的に、このコンペティションは、アクセス可能でオープンソースのリソースを使用して、コミュニティが高度な構造化推論モデルを成功裏にトレーニングできることを証明し、AI開発を民主化しました。 How the community trained Gemma to "Think" with Tunix and TPUs developers.googleblog.com
Google Pay & Wallet Developer MCPサーバーで統合ワークフローを強化しましょう Googleは、AI開発アシスタントとIDEをリアルタイムのAPIおよびアカウントコンテキストに安全に接続するように設計されたオープンスタンダードツールである、新しいGoogle Pay & Wallet Developer MCPサーバーを発表しました。このサーバーにより、開発者は開発環境内に留まり、公式ドキュメントを検索したり、Walletパス定義を検証したり、統合ステータスを確認したり、マーチャントアカウントを管理したりすることができます。最終的に、この統合は、コンテキストスイッチングを最小限に抑え、最新の、根拠のあるAIサポートを提供することにより、摩擦を軽減し、開発ワークフローを加速することを目的としています。 Supercharge your integration workflow with the Google Pay & Wallet Developer MCP server developers.googleblog.com
Google Payの最新アップデート Google Payは、Universal Commerce Protocolと、AIエージェントが統合を管理しトレンドを分析できる新しいMCPサーバーを導入することで、「エージェンティックコマース」へと進化しています。新しいAndroidアップデートでは、シームレスなエクスプレスチェックアウトのための動的なコールバックが導入され、WebViewを介してソーシャルメディアアプリへの支払いサポートが拡張されます。さらに、プラットフォームはクロスデバイスの生体認証と新しいトランザクションシグナルをローンチし、マーチャントが摩擦を軽減し、処理コストを最適化するのを支援します。 The latest updates to Google Pay developers.googleblog.com
Google Payにおける動的コールバックによるAndroidチェックアウトの強化 Google PayによるExpress checkoutをAndroidネイティブアプリで提供できることを嬉しく思います。これにより、開発者は… Enhancing Android Checkout with Dynamic Callbacks in Google Pay developers.googleblog.com
Kotlin向けADKおよびAndroid向けADK 0.1.0を発表:Androidおよびそれ以降でのAIエージェント構築 ADK for Kotlin は、バックエンドプロジェクトにエージェントワークフローをもたらし、ADK for Android は、スペ... Announcing ADK for Kotlin and ADK for Android 0.1.0: Building AI Agents on Android and Beyond developers.googleblog.com
Gemini for Homeによるサービスプロバイダーおよびハードウェアパートナーのエンパワーメント Googleは、高度なカメラインテリジェンス、自然言語クエリ、日々の活動の要約を統合したフルスタックのGemini AIオファリングをローンチすることで、スマートホームエコシステムを拡大しています。この取り組みは、サービスプロバイダーやハードウェアメーカーに、ターンキーのリファレンスデザインとAPIを提供し、広範な研究開発なしにプロアクティブでブランド化されたサービスを構築できるようにします。最終的に、このプログラムは、基本的なデバイス制御を超えて、コンテキストを理解し、ユーザーのニーズにリアルタイムで対応できるAIネイティブなホームを目指しています。 Empowering Service Providers and Hardware Partners with Gemini for Home developers.googleblog.com
イノベーションの1年:Google Cloud x NVIDIA Developer Community 10万人のメンバーを祝して Google CloudとNVIDIAの開発者コミュニティは、10万人のメンバーと共に1周年を祝っており、ビルダーに高度なAIインフラストラクチャとリソースを提供するという新たな重点を置いています。開発を加速するために、コミュニティはLLM最適化、GPUアクセラレーテッドデータ分析を習得するためのキュレーションされた学習パスと、毎月の専門家主導のウェビナーを提供しています。2年目に入るにあたり、このイニシアチブはハンズオンラボ、エンジニアリングイベント、そしてエージェンティックAIの成長に焦点を当てた専門コンテンツを含めるように拡大されます。 One Year of Innovation: Celebrating 100k Members in the Google Cloud x NVIDIA Developer Community developers.googleblog.com
Google I/O 2026 デベロッパー基調講演の全ニュース Googleは、Gemini 3.5シリーズのローンチと、エージェントファースト開発プラットフォームAntigravityのメジャーアップデートを強調し、アシスタティブAIから独立型エージェントへの移行を発表しました。モバイル開発者向けには、新しいAndroid CLIツール、Android Bench評価リーダーボード、およびさまざまなフレームワークをネイティブKotlinコードに迅速に変換するように設計された自動移行エージェントが紹介されています。Web開発も、エージェント向けのChrome DevTools、HTML-in-Canvas API、そしてブラウザベースのAIエージェントが複雑なタスクを実行できるようにするオープンWeb標準であるWebMCPの提案によって変革されています。 All the news from the Google I/O 2026 Developer keynote developers.googleblog.com
LiteRT-LMによる超高速オンデバイスGenAI Google AI Edge の LiteRT-LM は、Gemma 4 をクロスプラットフォームのモバイルおよびエッジ環境で実行するための、本番環境で実績のある高度に最適化されたインフラストラクチャを提供します。メモリ効率の高い動的ローディング、最大 2.2 倍の速度向上を実現する Multi-Token Prediction、および Thinking Mode や Constrained Decoding のような高度なオーケストレーションツールを活用することで、オンデバイスでモデルのネイティブなマルチモーダルおよびエージェンティック機能を積極的に解き放ちます。さらに、このエンジンは Android 以外の統合サーフェスを急速に拡大しており、Apple エコシステム向けの新しいネイティブ Swift API と、高性能なサーバーレスブラウザ推論のための WebGPU アクセラレーテッド JavaScript API を導入しています。 Blazing fast on-device GenAI with LiteRT-LM developers.googleblog.com
Google Tensor SDK Beta with LiteRT Google Tensor ML SDKがベータ版に移行し、開発者はGoogle Pixel 10デバイスのTPU上で直接高性能な機械学習モデルを構築・デプロイできるようになります。GoogleのエッジデプロイメントフレームワークであるLiteRTと統合することで、SDKは開発者がPyTorchまたはTFLiteモデルを変換、コンパイル、実行するための統一されたワークフローを、堅牢なフォールバックオプションとともに提供します。さらに、新しいモデルガーデンは、Gemma 3を含む100以上のクラシックおよび生成AIモデルを提供し、音声認識、コンピュータビジョン、テキスト生成などの低遅延でプライベートな機能を実現します。 Google Tensor SDK Beta with LiteRT developers.googleblog.com
よりスマートなGoogle AIエッジギャラリー:MCP統合、通知、セッション継続 Google AI Edge Galleryアプリは、AndroidにおけるオープンソースのModel Context Protocol(MCP)の実験的サポートを導入し、オンデバイスAI機能を拡張しました。これにより、Gemma 4はGoogle WorkspaceやGoogle Mapsなどの外部データソースを横断する複雑なタスクを調整できるようになります。より積極的で持続的なユーザーインタラクションを可能にするため、今回のアップデートではルーチンを自動化するための「スケジュール通知」スキルと、長いセッションコンテキストをほぼ瞬時に復元する永続的なチャット履歴機能が追加されました。オープンソースツールキットによって推進されるこのプラットフォームは、コミュニティ開発者がGitHubリポジトリを通じてカスタムユーティリティ中心のワークフロー、プロンプト構成、ツール統合を構築・共有することを奨励しています。 A Smarter Google AI Edge Gallery: MCP integration, notifications, and session continuity developers.googleblog.com
重要なお知らせ:Gemini CLIからAntigravity CLIへの移行 Googleは、コミュニティ中心のGemini CLIを、複雑でマルチエージェントのワークフロー向けに構築された新しいエージェントファーストプラットフォームであるAntigravity CLIに移行することで、AIターミナルツールを統合しています。この新しいGoベースのツールは、より高速な実行、非同期処理、およびAntigravity 2.0デスクトップアプリケーションと同期する統一されたアーキテクチャを提供します。エンタープライズ顧客は既存のアクセスを維持しますが、個人および無料ユーザーは、Gemini CLIが2026年6月18日にリクエストの提供を停止する前に、新しいプラットフォームに移行する必要があります。 An important update: Transitioning Gemini CLI to Antigravity CLI developers.googleblog.com
Genkit Middlewareを発表:エージェント型アプリケーションをインターセプト、拡張、強化する Genkitは、TypeScript、Go、Dart、Pythonを使用して、本番環境に対応したエージェンティックAIアプリケーションを開発するためのオープンソースフレームワークです。このフレームワークは、強力なミドルウェアシステムを利用しており、生成呼び出しをインターセプトして、リトライ、モデルフォールバック、人間参加型のツール承認などのカスタム動作を注入します。generate、model、toolレイヤーにフックをアタッチすることで、開発者はモデル出力に対する高い信頼性と決定論的な制御を確保できます。さらに、Genkitではカスタムミドルウェアの作成とスタッキングが可能であり、これらすべては専用のDeveloper UIを通じて検査およびデバッグできます。 Announcing Genkit Middleware: Intercept, extend, and harden your agentic apps developers.googleblog.com
オンデバイスAIの加速:ArmとGoogleのAIエッジ最適化について Arm Scalable Matrix Extension 2 (SME2) と Google AI Edge ソフトウェアスタックの統合により、CPU を強力な行列計算アクセラレータに変換することで、高性能なオンデバイス生成 AI が可能になります。Stability AI の「stable-audio-open-small」モデルをケーススタディとして、LiteRT、XNNPACK、および KleidiAI を利用してハードウェアアクセラレーションを自動化する、合理化された「変換、最適化、およびデプロイ」パイプラインの概要を説明します。結果として実装されたものは、オーディオ生成で 2 倍以上の高速化とメモリ使用量で 4 倍の削減を達成し、Arm 搭載のモバイルデバイスおよびラップトップで高音質を維持します。 Accelerating on-device AI: A look at Arm and Google AI Edge optimization developers.googleblog.com
ADKで、一時停止、再開が可能で、コンテキストを失わない、長時間実行AIエージェントを構築する ステートレスチャットボットから、HRオンボーディングのように数日または数週間に及ぶ長期的なエンタープライズワークフローを管理できる本番グレードのエージェントへの移行方法。エージェント開発キット(ADK)とそのアーキテクチャの変更を紹介し、特に耐久性のあるステートマシンと永続的なセッションストレージを使用して、エージェントが「アイドル時間」やサーバーの再起動中にコンテキストを失わないようにします。イベント駆動型のWebhookとマルチエージェントの委任を活用することで、チュートリアルでは、一時停止中に「スリープ」し、複雑なタスクを高い推論精度で再開するために「ウェイクアップ」する回復力のあるシステムを構築する方法を示します。 Build Long-running AI agents that pause, resume, and never lose context with ADK developers.googleblog.com
Google TPUでのLLM推論の超高速化:拡散モデル風の投機的デコーディングによる3倍の速度向上 UCSDの研究者は、Google TPU上でブロック拡散投機的デコーディング手法であるDFlashを実装し、従来の自己回帰ドラフトの逐次的なボトルネックを回避することに成功しました。トークン候補のブロック全体を一度に予測するのではなく、一度のフォワードパスで「ペイント」することで、システムは平均3.13倍の速度向上を達成し、ピーク性能はEAGLE-3のような既存の手法をほぼ2倍にしました。vLLMエコシステムへのこのオープンソース統合は、「無料」の並列検証と複雑な推論タスクのための高品質なドラフト予測を活用することで、TPUハードウェアを最適化します。 Supercharging LLM inference on Google TPUs: Achieving 3X speedups with diffusion-style speculative decoding developers.googleblog.com
Gemini Embedding 2 による構築:エージェント型マルチモーダル RAG とその先 Googleは、テキスト、画像、動画、音声、ドキュメントを単一のセマンティック空間にマッピングする統合モデルであるGemini Embedding 2の一般提供を発表しました。このモデルにより、開発者はインターリーブされたマルチモーダル入力を単一のリクエストで処理できるようになり、エージェンティックRAG、ビジュアル検索、コンテンツモデレーションなどのタスクのパフォーマンスが大幅に向上します。100以上の言語をサポートし、タスク固有のプレフィックスやマトリョーシュカ次元削減などの機能を提供することで、このモデルは複雑なAIエージェントを構築するための非常に効率的で正確な基盤を提供します。 Building with Gemini Embedding 2: Agentic multimodal RAG and beyond developers.googleblog.com
AIの高速化:GCSFSとRapid Bucketを使ってGoogle ColossusをPyTorchに導入 Google Cloud は、AI トレーニングのボトルネックを解消するため、fsspec インターフェースを介して Rapid Storage を PyTorch に直接接続する高性能な統合を導入しました。Google の Colossus アーキテクチャと双方向 gRPC ストリーミングを利用することで、このソリューションは最大 15 TiB/秒 の集約スループットと、大幅なレイテンシの削減を実現します。これらの改善により、開発者はストレージバケットの種類を更新するだけで、コードを変更することなく、総トレーニング時間を 23% 短縮できます。 Speeding Up AI: Bringing Google Colossus to PyTorch via GCSFS and Rapid Bucket developers.googleblog.com
LiteRTとNPUを用いた実世界のオンデバイスAI構築 LiteRT は、モバイル開発者がニューラルプロセッシングユニット (NPU) の力を最大限に引き出し、従来の CPU や GPU 処理のパフォーマンスとバッテリーの制約を克服できるように設計された、実用的なフレームワークです。ハードウェアの複雑さを抽象化した統一された API を提供することで、Google Meet や Epic Games などの業界リーダーが、リアルタイムビデオ、アニメーション、音声認識のための洗練された AI モデルを、大幅に高い効率で展開することを可能にします。さらに、このプラットフォームは、ベンチマークツールとクロスプラットフォーム互換性を通じて開発者をサポートし、モバイルデバイス、AI PC、産業用 IoT ハードウェア全体でのシームレスな AI 展開を可能にします。 Building real-world on-device AI with LiteRT and NPU developers.googleblog.com
エージェントプラットフォームのCLI:1つのCLIで開発から本番まで Google Cloud は、ローカル開発と本番環境レベルの AI エージェント展開の間のギャップを埋めるために設計された専門ツールである Agents CLI を導入しました。この CLI は、コーディングアシスタントに完全な Google Cloud スタックへの機械可読アクセスを提供し、スキャフォールディングプロセス中のコンテキストの過負荷とトークンの無駄を削減します。評価、インフラストラクチャのプロビジョニング、および展開を単一のプログラム可能なバックボーンに統合することで、このツールにより、開発者は初期のコンセプトからライブサービスまで、数週間ではなく数時間で移行できます。 Agents CLI in Agent Platform: create to production in one CLI developers.googleblog.com
本番環境対応のAIエージェント:モノリスのリファクタリングから学ぶ5つの教訓 このブログ記事は、GoogleのAgent Development Kit (ADK) を使用して、もろい販売調査プロトタイプを堅牢なプロダクションエージェントに移行させる過程を概説しています。モノリシックなスクリプトを、オーケストレーションされたサブエージェントと構造化されたPydantic出力に置き換えることで、開発者はサイレントフェイラーと脆弱なパースを排除しました。さらに、記事では、AIエージェントが現実世界のアプリケーションでスケーラブルで、費用対効果が高く、透明性を持つために、動的なRAGパイプラインとOpenTelemetryによる可観測性が不可欠であることを強調しています。 Production-Ready AI Agents: 5 Lessons from Refactoring a Monolith developers.googleblog.com
A2UI v0.9: ポータブルでフレームワークに依存しないジェネレーティブUIの新しいスタンダード A2UI v0.9 は、AIエージェントが企業の既存のデザインシステムを使用して、リアルタイムでカスタマイズされたUIウィジェットを生成するのに役立つ、フレームワークに依存しない標準を導入しました。このアップデートは、Python用の新しいAgent SDK、共有Webコアライブラリ、React、Flutter、Angularなどのレンダラーの公式サポートにより、開発者エクスペリエンスを簡素化します。UIの意図を特定のプラットフォームから切り離すことで、このリリースは、Webおよびモバイルアプリケーション全体で、生成インターフェースのシームレスで低遅延のストリーミングを可能にします。AG2やVercelなどのより広範なエコシステムとの統合により、A2UI v0.9 は、生成UIを実験的なデモから、本番環境に対応したデジタル製品へと移行させることを目指しています。 A2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UI developers.googleblog.com
MaxText が事後学習機能を拡張:シングルホスト TPU 上での SFT と RL を導入 MaxText は、JAX と Tunix ライブラリを活用し、単一ホスト TPU 構成での教師ありファインチューニング (SFT) と強化学習 (RL) の新しいサポートを導入しました。これにより、高性能なモデルの洗練が可能になります。これらの機能により、開発者は、GRPO や GSPO などの効率的なアルゴリズムを使用して、事前学習済みのモデルを専門的なタスクや複雑な推論に簡単に適応させることができます。このアップデートは、ポストトレーニングワークフローを合理化し、単一ホスト構成からより大規模なマルチホスト構成へのスケーラブルなパスを提供します。 MaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUs developers.googleblog.com
Gemini CLIにサブエージェントが到着しました Gemini CLI にサブエージェントが導入されました。これは、複雑なタスクや大量のタスクを分離されたコンテキストウィンドウで処理する専門のエージェントで、プライマリセッションを高速かつ集中した状態に保ちます。これらのエージェントは、Markdown ファイルでカスタマイズでき、並列実行して生産性を向上させ、ターゲットを絞った委任のために `@agent` 構文を使用して簡単に呼び出すことができます。このアーキテクチャは、複雑な複数ステップの実行を簡潔な要約に統合することで、「コンテキストの劣化」を防ぎます。 Subagents have arrived in Gemini CLI developers.googleblog.com
Google Pay API によるマーチャント主導型トランザクションの新しい強化機能 Googleは、開発者が加盟店主導のトランザクション(MIT)に対して、より柔軟性と制御性を持てるように、Google Pay APIの強化を発表しました。このアップデートには、定期購読、ホテル予約のような延期払い、自動アカウントリロードを特別に処理するためのPaymentDataRequest内の新しいオブジェクトが含まれています。加盟店が将来の支払い条件を明確に定義できるようにすることで、これらの変更はユーザーの透明性を向上させ、トークン管理の改善を通じてトランザクションの却下を減らすのに役立ちます。開発者はこれらの機能を利用して、よりシームレスで安全な長期的な支払い体験を構築できるようになります。 New enhancements for merchant initiated transactions with the Google Pay API developers.googleblog.com
より良いAIエージェントを構築する:Agent Bake-Offからの5つの開発者向けヒント Google Cloud AI Agent Bake-Off は、単純なプロンプトエンジニアリングから、厳密なエージェントエンジニアリングへのシフトを浮き彫りにしています。これは、実用的なAIには、モジュール化されたマルチエージェントアーキテクチャが必要であることを強調しています。この投稿では、5つの重要な開発者向けヒントが概説されています。これには、複雑なタスクを専門的なサブエージェントに分解することや、確率的なエラーを防ぐために決定論的なコードを実行に使用することが含まれます。さらに、エージェントがスケーラブルで統合され、急速に進化するモデルの能力に対して将来的に対応できるように、マルチモーダル性や MCP のようなオープンソースプロトコルを優先することを開発者に推奨しています。 Build Better AI Agents: 5 Developer Tips from the Agent Bake-Off developers.googleblog.com
Google I/O の準備をしましょう:ライブストリームのスケジュールが公開されました Google I/O が 5 月 19 日~20 日に開催され、AI、Android、Chrome、Cloud の主要なアップデートが発表されます。イベントは、開発の「エージェント時代」に関する基調講演から始まります。複雑なワークフローを自動化し、高品質で AI 対応のアプリケーションの作成を簡素化するように設計された新しいツールに焦点を当てます。参加者は、ライブセッション、技術デモ、専門能力開発リソースに、ライブおよびオンデマンドでアクセスするために登録できます。 Get ready for Google I/O: Livestream schedule revealed developers.googleblog.com
TorchTPU: Google規模でPyTorchをTPU上でネイティブに実行 TorchTPU は、Google の TPU インフラストラクチャ上で PyTorch ワークロードをネイティブかつ高性能に実行するための新しいエンジニアリングスタックです。最小限のコード変更で実現します。「Eager First」アプローチを採用し、複数の実行モードを備え、XLA コンパイラを利用して、大規模なクラスター全体での分散トレーニングを最適化します。2026 年に向けて、このプロジェクトはコンパイルオーバーヘッドをさらに削減し、動的形状とカスタムカーネルのサポートを拡大することで、次世代 AI のシームレスなスケーラビリティを確保することを目指しています。 TorchTPU: Running PyTorch Natively on TPUs at Google Scale developers.googleblog.com
アプリ内でのGoogleアカウントユーザー名変更のサポート Googleは、米国ユーザーが既存のアカウントデータと受信トレイをそのまま保持したまま、@gmail.comのユーザー名を変更できるようにアカウント設定を更新しました。開発者にとって、これは、古いメールアドレスがエイリアスとして引き続き有効である一方で、メールアドレスのみを識別に使用しているアプリは、アカウントの重複やアクセス権の喪失といった問題に直面する可能性があることを意味します。シームレスなユーザーエクスペリエンスを確保するために、Googleは、主要なユーザー識別子として「subject ID」に移行し、ユーザーがアプリ設定内で連絡先情報を手動で更新できるようにすることを推奨しています。 Supporting Google Account username change in your app developers.googleblog.com
Gemma 4で、最先端のエージェントスキルをエッジに Google DeepMind は、デバイス上で直接マルチステップの計画と自律的なエージェントワークフローを可能にするために設計された、最先端のオープンモデルファミリーである Gemma 4 をリリースしました。このリリースには、「エージェントスキル」を試すための Google AI Edge Gallery と、開発者に大幅な速度向上と構造化された出力を提供する LiteRT-LM ライブラリが含まれています。Apache 2.0 ライセンスで提供される Gemma 4 は、140 以上の言語をサポートし、モバイルデバイス、デスクトップ、Raspberry Pi などの IoT プラットフォームを含む幅広いハードウェアと互換性があります。 Bring state-of-the-art agentic skills to the edge with Gemma 4 developers.googleblog.com
スキルを備えたADKエージェントを構築するための開発者ガイド Agent Development Kit (ADK) の SkillToolset は、「プログレッシブ・ディスクロージャー」アーキテクチャを導入し、AIエージェントがドメイン知識をオンデマンドでロードできるようにすることで、従来のモノリシックなプロンプトと比較してトークン使用量を最大90%削減します。単純なインラインチェックリストから、エージェントが独自のコードを作成する「スキルファクトリー」まで、4つの異なるパターンを通じて、このシステムは agentskills.io のユニバーサル仕様を使用して、実行時にエージェントが動的に能力を拡張できるようにします。このモジュール式アプローチにより、複雑な指示や外部リソースは関連する場合にのみアクセスされるため、最新のAI開発のためのスケーラブルで自己拡張可能なフレームワークが実現します。 Developer’s Guide to Building ADK Agents with Skills developers.googleblog.com
OrbaxとMaxTextにおける継続的なチェックポイントによる信頼性最適化:トレーニングのスループット向上 OrbaxとMaxTextに新たに導入された継続的チェックポインティング機能は、モデルトレーニング中の信頼性とパフォーマンスのバランスを最適化するように設計されており、従来の固定頻度チェックポインティングの問題に対処します。信頼性を損なうか、パフォーマンスのボトルネックとなる可能性のある固定間隔とは異なり、継続的チェックポインティングは、前の保存操作が正常に完了した後にのみ新しい保存操作を非同期的に開始することで、I/O帯域幅を最大化し、障害リスクを最小限に抑えます。ベンチマークによると、このアプローチはチェックポイント間隔を大幅に短縮し、特に平均故障間隔(MTBF)が短い大規模トレーニングジョブにおいて、リソースの大幅な節約につながることが示されています。 Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and MaxText developers.googleblog.com
ADK Go 1.0登場! Go 1.0 用 Agent Development Kit (ADK) のリリースは、実験的な AI スクリプトから、可観測性、セキュリティ、拡張性を重視した実稼働対応サービスへの大きな転換点となります。主な更新点としては、詳細なトレースのためのネイティブ OpenTelemetry 統合、自己修復ロジックのための新しいプラグインシステム、そして機密性の高い操作中の安全性を確保するための「Human-in-the-Loop」確認が含まれます。さらに、このリリースでは、迅速な反復処理のための YAML ベースの設定と、異なるプログラミング言語間でのシームレスな通信をサポートする洗練された Agent2Agent (A2A) プロトコルが導入されています。このフレームワークにより、開発者は Golang の高性能エンジニアリング基準を用いて、複雑で信頼性の高いマルチエージェントシステムを構築できるようになります。 ADK Go 1.0 Arrives! developers.googleblog.com
ADK for Java 1.0.0 リリースのお知らせ:JavaでAIエージェントの未来を構築 Google は、Java 用 Agent Development Kit (ADK) のバージョン 1.0.0 をリリースしました。このバージョンでは、Google マップのグラウンディング、組み込みの URL フェッチ、クロスフレームワーク連携のための標準化された Agent2Agent プロトコルといった強力な新機能が導入されています。このアップデートでは、新しい「App」および「Plugin」アーキテクチャにより、エージェントの制御が強化されています。これにより、グローバルロギング、イベント圧縮による自動コンテキストウィンドウ管理、「Human-in-the-Loop」ワークフローによるアクション確認が可能になります。さらに、このリリースでは、Firestore や Vertex AI などの Google Cloud 連携を活用した堅牢なセッションおよびメモリサービスが提供され、長期的な状態や大規模なデータ成果物を管理できます。 Announcing ADK for Java 1.0.0: Building the Future of AI Agents in Java developers.googleblog.com
エージェント・スキルで知識ギャップを埋める Google DeepMind は、静的なモデル知識と急速に進化するソフトウェアプラクティスの間のギャップを埋めるために、エージェントにライブドキュメントと SDK ガイダンスを提供する「Gemini API 開発者スキル」を開発しました。評価結果は大幅なパフォーマンス向上を示しており、gemini-3.1-pro-preview モデルは、このスキルを装備することで成功率が 28.2% から 96.6% へと飛躍的に向上しました。この軽量なアプローチは、モデルに強力な推論能力と「真実の情報源」へのアクセスを与えることで、いかに時代遅れのコーディングパターンを効果的に排除できるかを示しています。 Closing the knowledge gap with agent skills developers.googleblog.com
プレイにジャンプ:GeminiとMediaPipeでの建築 このワークフローは、Gemini Canvasを使用して、MediaPipe Pose Landmarkerのようなメカニズムをハイレベルなプロンプトで迅速にプロトタイピングすることにより、モーションコントロールゲームの開発を効率化します。開発者は、Google AI Studioで、低遅延の「lite」モデルと、肩のランドマークなどの安定したトラッキングポイントに最適化することで、これらのプロトタイプを洗練させ、応答性の高いゲームプレイを保証します。このプロセスは、Gemini Code Assistを使用して、実験的なコードを、さまざまなマルチモーダル入力をサポートできる、モジュール化された、実用的なアプリケーションにリファクタリングすることで完了します。 Jump to play: Building with Gemini & MediaPipe developers.googleblog.com
LlamaParseとGemini 3.1を使って、スマートな金融アシスタントを構築する このブログ記事では、LlamaParseとGemini 3.1モデルを組み合わせることで、複雑で構造化されていないドキュメントから高品質なデータを抽出するワークフローを紹介します。密度の高い財務表の代理解析にGemini 3.1 Proを、費用対効果の高い要約にGemini 3.1 Flashを使用するイベント駆動型アーキテクチャを実演しています。提供されているチュートリアルに従うことで、開発者は、煩雑な証券会社の明細書を構造化された、人間が理解しやすいインサイトに変換できるパーソナルファイナンスアシスタントを構築できます。 Build a smart financial assistant with LlamaParse and Gemini 3.1 developers.googleblog.com
AIエージェントプロトコルの開発者ガイド このブログ記事では、AIエージェントがデータにアクセスし、互いに通信する方法を標準化することで、カスタム統合コードを不要にするように設計された、MCPやA2Aなど6つのプロトコル群を紹介します。実用的な例として「キッチンマネージャー」エージェントを使用し、これらのツールがリアルタイムの在庫確認、UCP経由での卸売取引、AP2による安全な支払い承認といった複雑なタスクをどのように処理するかを説明します。また、Agent Development Kit (ADK) を活用することで、開発者はA2UIとAG-UIを実装し、インタラクティブなダッシュボードとシームレスなストリーミングインターフェースをユーザーに提供することもできます。 Developer’s Guide to AI Agent Protocols developers.googleblog.com
Colab MCP サーバー発表:あらゆる AI エージェントを Google Colab に接続 Gemini CLI、Claude Code、あるいはあなた自身のAIエージェントのようなAIエージェントを使ってローカルでプロトタイピングを行う際、それらは… Announcing the Colab MCP Server: Connect Any AI Agent to Google Colab developers.googleblog.com