Google Developers Blog 日本語 - TheNote.app

Google Developers Blog 日本語
フォロー

Developers.googleblog.comは、Googleからの公式デベロッパーブログです。ここでは、Googleが提供する様々なデベロッパーツールとその機能、バグフィックス、開発スキル向上のためのチュートリアルに関する包括的な情報を提供します。このブログはまた、Googleのソフトウェア開発プロジェクトに関するケーススタディ、インタビュー、コミュニティーニュースも掲載しています。

RSS developers.googleblog.com

Google Developers Blog developers.googleblog.com

RSS Hunter • 2024年8月23日

ノートのスレッド

TPU で Ray を実行する、パート 2: Ray AI ライブラリ

この第2弾では、RayのハイレベルライブラリであるServe、Data、Trainが、GoogleのTPUスライス上でAIワークロードを実行する際の複雑さをどのように抽象化するかを探ります。Ray Serveはシンプルなトポロジー構成を使用して、大規模なマルチホストモデルを正しくギャングスケジューリングし、Ray DataはネイティブJAXバッチでアクセラレータに直接データを供給することでデータローディングのボトルネックを解消します。最後に、JaxTrainerは、クロススライス調整、チェックポインティング、および耐障害性を自動的に処理することで、TPU全体での分散トレーニングを合理化します。

Run Ray on TPU, Part 2: Ray AI libraries developers.googleblog.com

RSS Hunter • 7月24日

スケーリングエージェントRL：Tunixによる高スループットエージェントトレーニング

Tunixは、Googleの新しいJAXネイティブのポストトレーニングライブラリであり、マルチターンのツール使用LLM推論エージェントのトレーニングにおけるTPUアイドル時のボトルネックを解消するように設計されています。これは、高度に並行した非同期ロールアウトと、分離されたプロデューサー・コンシューマーパイプラインを組み合わせることでハードウェアのスループットを最大化し、エージェントがネットワークI/Oや環境ステップを待機している間でもトレーナーに常にデータが供給されるようにします。さらに、Tunixはプラグアンドプレイの抽象化と継続的なマクロレベルのプロファイリングを提供し、開発者がカスタムオープンソース環境を簡単に統合し、大規模なコードの書き直しなしに複雑な分散ワークフローを最適化できるようにします。

Scaling Agentic RL: High-Throughput Agentic Training with Tunix developers.googleblog.com

RSS Hunter • 7月21日

TPUでRayを実行する、第1部：基礎編

Ray 2.55 は、Google Cloud TPU の公式なファーストクラスサポートを導入し、開発者が使い慣れた Ray のタスクおよびアクター API を使用して、Google のアクセラレータ上で分散 Python ワークロードを実行できるようになります。マルチホスト TPU "スライス" をチップ間相互接続 (ICI) を介して連携させるという厳格なネットワーク要件を処理するため、GKE 上の KubeRay Operator は、基盤となるハードウェアレイアウトを自動的にプロビジョニングおよびラベル付けします。Ray Core は、このラベルを slice_placement_group() プリミティブ経由で利用し、完全なスライスをアトミックに予約します。これにより、開発者はカスタム配置コードを書くことなく、ハードウェアトポロジー（例：「4x4」）を宣言するだけで、KubeRay、Ray Train、または Ray Serve を介してジョブをデプロイできます。

Run Ray on TPU, Part 1: The foundations developers.googleblog.com

RSS Hunter • 7月20日

進化する仕様駆動開発：ConductorがAntigravityをサポート

ConductorはGemini CLI拡張からポータブルプラグインへと進化し、Antigravity CLIやClaudeのようなエコシステムに会話型Spec-Driven Development (SDD) をもたらしました。厳格なコマンドシーケンスに依存するのではなく、開発者はAIアシスタントと自然にチャットできるようになり、その間、AIアシスタントはバックグラウンドで永続的なマークダウン成果物（spec.mdやplan.mdなど）を動的に管理します。このアップデートにより、ワークフローの摩擦が解消され、リポジトリがプロジェクトのアーキテクチャと状態のバージョン管理された単一の真実の情報源として維持されることが保証されます。

Evolving Spec-Driven Development: Conductor Now Supports Antigravity developers.googleblog.com

RSS Hunter • 7月16日

スケーラブルなAIエージェントをモジュラープロンプトトランスピレーションで構築する

モノリシックなシステムプロンプトに起因するスケーリングのボトルネックと実行時エラーを解決するために、エンジニアリングチームは、指示を再利用可能なテンプレートにモジュール化することで、プロンプトをビルド成果物として扱うべきです。これらのモジュール化された「スキルファイル」をトランスパイラで実行することにより、開発者は静的検証を強制し、ビルド時に不足している依存関係を検出し、プロンプト生成をCI/CDパイプラインに直接統合できます。この決定論的なアプローチは、コードドリフトを防ぎ、最終的にエージェントが標準的なプルリクエストを通じて自身のロジックの更新を提案できる安全なフレームワークを確立します。

Building scalable AI agents with modular prompt transpilation developers.googleblog.com

RSS Hunter • 7月16日

Gemini Enterprise Agent Platformにおける選択肢の拡大：並列Web検索によるグラウンディングの導入

Google CloudはParallel Web Systemsと提携し、Parallelの検索インフラストラクチャをGemini Enterprise Agent Platform上のWebグラウンディングプロバイダーとしてネイティブに統合しました。この統合により、開発者は検証可能でリアルタイムなWebの結果にAIエージェントをアンカーさせることができ、複雑なエンタープライズワークフローにおける事実の正確性を大幅に向上させることができます。さらに、この提携は、ユーザーが他の大規模言語モデルと並行してWebデータをプログラムで抽出し、永続的にキャッシュし、処理することを可能にする、拡張されたアーキテクチャの柔軟性を提供します。

Expanding Choice in Gemini Enterprise Agent Platform: Introducing Grounding with Parallel Web Search developers.googleblog.com

RSS Hunter • 7月16日

Google TensorとPixelでオンデバイスAIの次の時代を解き放つ

Google I/O Connect Indiaにおいて、Googleは、新しいPixel 10ファミリー向けのカスタムTensor SoCとTPUによって実現される、100%プライベートでオンデバイスAIの未来を披露しました。このイベントでは、軽量なGemma 4 E2Bモデルが初公開され、デバイス上でネイティブに動作することで、AIチャット、リアルタイム画像認識、パーソナルエージェントタスクなどの完全にオフラインのマルチモーダル機能を可能にします。開発者は、本日発表されたTensor SDKベータ版とその付属のオープンソースリソースにアクセスすることで、これらのセキュアなエッジベースアプリケーションの構築を開始できます。

Unlocking the Next Era of On-Device AI with Google Tensor and Pixel developers.googleblog.com

RSS Hunter • 7月14日

システムエンジニアリングプレイブック：Ironwood (TPU7x) 上での Qwen 3.5-397B MoE の最適化

397BパラメータのQwen 3.5 Mixture-of-Experts（MoE）モデルをIronwood TPUで提供するために、エンジニアはモジュラーJAX/Pallas最適化スタックを開発し、プリフィル負荷の高いワークロードで最大4.7倍の推論速度向上を達成しました。チームは、ハイブリッドデータ並列化とエキスパート並列化（DP+EP）トポロジーを展開することで、厳しいハードウェアシャーディングの制約を回避しました。これは、カスタム低レベル通信フュージョン（階層的なreduce-scatterなど）と組み合わせて、クロスデバイスのトークンルーティングを最適化しました。最後に、ハードウェアを意識したカスタムカーネル（Batched Ragged Page Attentionや完全にフューズされたGated DeltaNet（GDN）ブロックなど）を実行することで、HBM帯域幅とTensorCore MXUを効果的に活用し、システムスループットを理論上のルーフラインリミット近くまで押し上げました。

Systems Engineering Playbook: Optimizing Qwen 3.5-397B MoE on Ironwood (TPU7x) developers.googleblog.com

RSS Hunter • 7月14日

LiteRT.js, Googleの高性能Web AI推論

LiteRTファミリーの最新メンバーであるLiteRT.jsをご紹介できることを嬉しく思います！LiteRT.jsは、機械学習モデルをブラウザで直接実行するための強力なソリューションであり、GoogleのクロスプラットフォームエッジAIランタイムをWebに拡張します。JavaScript開発者向けに構築されたLiteRT.jsは、WebGPUおよび今後のWebNNで最先端のMLモデル推論パフォーマンスを提供し、CPUにはWebAssemblyへのフォールバックを備えています。この記事では、LiteRT.jsの簡単なツアーを紹介し、Web開発者が必要なすべてを提供して開始できるようにします。

LiteRT.js, Google's high performance Web AI Inference developers.googleblog.com

RSS Hunter • 7月9日

ドメインギャップを埋める：AntigravityとGeminiで構築されたAIレースコーチ

2026年5月23日、Google I/Oのステージを降りたばかりのGoogle Developer Experts (GDEs) が集結したのは…

Bridging the Domain Gap: AI Race Coach built with Antigravity and Gemini developers.googleblog.com

RSS Hunter • 7月8日

TPUをトレーニング途中で終了させ、数秒で復旧しました：MaxTextによる弾力的なトレーニング入門

分散AIトレーニングは、単一のマシンの故障が通常、マルチノードジョブ全体をクラッシュさせ、時間のかかるフルワークロードのインフラストラクチャ再起動を余儀なくされるため、非常に不安定であることが知られています。これを解決するために、GoogleのJAXエコシステムはPathwaysを介した弾力的なトレーニングを利用しており、ハードウェア障害をキャッチ可能なPython例外に変換することで、実行中のプロセスが生き残れるようにします。予期せぬ障害が発生した場合、システムは故障したワーカーのみを自動的に置き換え、Cloud Storageから最後に有効なチェックポイントを復元し、トレーニングをその場で再開します。これにより、メインコントローラープロセスを再起動することなく、合計ダウンタイムを2分未満に最小限に抑えます。

We terminated a TPU mid-training and it recovered in seconds: Introduction to elastic training with MaxText developers.googleblog.com

RSS Hunter • 7月6日

Genkit を使ってエージェント型フルスタックアプリを構築する

オープンソースのGenkitフレームワークは、メッセージ履歴、ツールループ、ストリーミングを単一のインターフェースにパッケージ化することで、会話型AIの複雑な配線を簡素化するように設計されたフルスタックツールであるAgents APIを導入しました。このAPIは、柔軟なサーバーまたはクライアント管理の状態永続化をサポートしており、履歴分岐、長時間実行されるデタッチされたタスク、マルチエージェントの連携などの高度なワークフローを可能にしながら、統一されたワイヤープロトコルを介してバックエンドとフロントエンドをシームレスに接続します。現在、TypeScriptとGoでプレビュー版が利用可能であり、Genkit Developer UIとも統合されており、開発者はクライアントコードを書かずにエージェントのスナップショットを簡単にテスト、デバッグ、検査できます。

Build agentic full-stack apps with Genkit developers.googleblog.com

RSS Hunter • 7月1日

ADK 2.0を開発した理由

「ADK 2.0を構築した理由」という質問に答える。この中で、その根拠、いくつかの機能、そして開発者がアップグレードを検討すべき理由を説明する。これはADK 2.0のローンチの翌日に公開される。

Why we built ADK 2.0 developers.googleblog.com

RSS Hunter • 7月1日

VS Code で Google Cloud Power を使った ML 開発：Workbench 拡張機能が利用可能になりました

VS Code 用の Google Cloud Workbench Notebooks 拡張機能が正式にリリースされ、開発者はローカル IDE をスケーラブルなクラウドベースの Jupyter 環境に接続できるようになりました。この統合により、コンテキストスイッチングが不要になり、高性能な Google Cloud インフラストラクチャに直接アクセスできるようになるため、機械学習ライフサイクルが合理化されます。透明性とコミュニティ主導のイノベーションをサポートするために、新しくリリースされた拡張機能は完全にオープンソースであり、GitHub および VS Code Marketplace で利用できます。

ML Development in VS Code with Google Cloud Power: Workbench Extension Now Available developers.googleblog.com

RSS Hunter • 7月1日

ADK Go 2.0で信頼性の高いマルチエージェントアプリケーションを構築しましょう。新しいグラフベースのワークフローエンジン、組み込みのヒューマン・イン・ザ・ループ、ダイナミックオーケストレーションをご覧ください。

Go 2.0 用の Agent Development Kit (ADK) がリリースされ、開発者が複雑なマルチエージェントアプリケーションを構成するのに役立つ、ファーストクラスのグラフベースのワークフローエンジンが導入されました。このアップデートでは、ヒューマン・イン・ザ・ループ (HITL) オーケストレーション、プレーンな Go コードを使用した動的な実行、指数関数的バックオフ再試行などの自動化されたレジリエンス機能のための組み込みプリミティブが追加されました。実行モデルを統一することで、シングルエージェントアプリケーションと複雑なグラフの両方が同じランタイムで実行され、テレメトリと状態の永続化が簡素化されます。

Build reliable multi-agent applications with ADK Go 2.0. Discover our new graph-based workflow engine, built-in human-in-the-loop, and dynamic orchestration developers.googleblog.com

RSS Hunter • 6月30日

コーディングエージェントからエージェント品質フライホイールを推進する

AIエージェントの開発では、単一のエラーを修正するためのプロンプトの微調整が、本番環境で広範なリグレッションを意図せず引き起こすのではないかと、開発者はしばしば不安を感じます。このギャップを埋めるために、Googleはコーディングエージェント向けの新しい開発者スキルを導入しました。これは、データ準備、推論の実行、適応型AutoRatersによる評価、失敗クラスターの分析、ターゲットを絞った最適化の実行という5段階の評価フライホイールを自動化します。本番トラフィックに対して継続的に実行するか、合成シナリオを介してオンデマンドで実行することで、このツールは開発者が平易な言葉でテスト目標を記述することを可能にし、独立した評価サービスが実際のパフォーマンスの向上を安全に検証およびカウントします。

Driving the Agent Quality Flywheel from Your Coding Agent developers.googleblog.com

RSS Hunter • 6月30日

GoogleのAgent Development KitとA2Aでクロス言語マルチエージェントチームを構築する

PythonエージェントとGoエージェントがAgent2Agentプロトコルを使用して契約コンプライアンスを共同で実行する方法

Build Cross-Language Multi-Agent Team with Google’s Agent Development Kit and A2A developers.googleblog.com

RSS Hunter • 6月22日

ジュールズと共に大切なものを測る

AIコーディングエージェントは、プロンプトに応じてタスクを完了する受動的なアシスタントから、急速に変化しています。

Measuring What Matters with Jules developers.googleblog.com

RSS Hunter • 6月22日

A2Aが協調型エージェントの世界を構築する方法

エージェント・ツー・エージェント（A2A）プロトコルの1周年を記念する本ブログ記事では、このフレームワークが、従来のAPIの厳格さなしに、自律的なAIエージェントが安全に協力し、タスクを引き継ぐことを可能にする方法を強調します。複雑なワークフローを専門的なピアエージェントに委任することで、A2Aはコンテキストの汚染を防ぎ、データのプライバシーを確保し、モジュール性を通じてアプリケーション設計を簡素化します。このエコシステムを実証するために、本記事では、複雑なタンパク質構造予測を調整するライフサイエンス向けのエージェンティックインターフェースであるFoldRunに焦点を当て、さらに、コマース、データストリーミング、DevOps、電気通信にわたる多様なA2Aユースケースを紹介します。

How A2A is Building a World of Collaborative Agents developers.googleblog.com

RSS Hunter • 6月18日

A2UI + MCP アプリ：宣言型とカスタムエージェントUIのベストを組み合わせる

この投稿では、Model Context Protocol (MCP) アプリと Agent-to-User Interface (A2UI) を統合するために設計された 3 つのアーキテクチャパターンを紹介し、高度にカスタマイズされた iframe 環境とネイティブな宣言的レンダリングとの間のトレードオフを解決します。これらのアプローチを組み合わせることで、開発者は MCP サーバー経由でネイティブな感覚の UI を直接提供したり、宣言的なビュー内に複雑でステートフルな iframe アプリを安全に埋め込んだり、レガシーシステムに生成 UI コンポーネントを注入したりできます。最終的に、これらのハイブリッドフレームワークは、エンジニアリングチームが、特定のプロジェクトの制約に合わせて調整された、安全でパフォーマンスが高く、ブランドの一貫性のあるエージェンティックなユーザーエクスペリエンスを提供できるようにします。

A2UI + MCP Apps: Combining the best of declarative and custom agentic UIs developers.googleblog.com

RSS Hunter • 6月17日

エージェンティック・リソース・ディスカバリ仕様を発表

ウェブ全体でツール、スキル、エージェントを見つけて検証するためのオープン仕様。エージェントは...

Announcing the Agentic Resource Discovery specification developers.googleblog.com

RSS Hunter • 6月17日

TPUスタックの力を解き放つ：新しいデベロッパーハブのご紹介

Googleは、モデルビルダーや開発者がGoogle Cloud TPUのパフォーマンスを最大限に引き出すことを支援するために設計された、一元化された教育リソースであるTPUデベロッパーハブを正式にローンチしました。このハブは、コードファーストのリソース、オープンソースのレシピ、そしてハードウェアアーキテクチャ、ソフトウェア最適化、デバッグ、並列処理、ネットワーキングを網羅する詳細なドキュメントを提供します。これらの資料は、大規模なトレーニングから低レイテンシの推論ワークロードまで、あらゆるものを効率化するために、人間の開発者とAI支援ツールの両方に合わせて調整されています。

Unlocking the Power of the TPU Stack: Introducing our new Developer Hub developers.googleblog.com

RSS Hunter • 6月16日

セキュリティと信頼性の向上：Googleでサインインする際の新しいセッションメタデータ

Googleは、Sign in with Googleを強化し、新しいOIDC標準クレーム（具体的にはauth_timeとamr（Authentication Methods Reference））を導入することで、開発者にセッションメタデータに関するより深い情報を提供します。これらのアップデートにより、検証済みのアプリはユーザーログインの「鮮度」と使用された認証方法（MFAやハードウェアキーなど）を検証できるようになり、より動的でリスクベースのアクセス制御が可能になります。これらのフェデレーテッドIDシグナルを活用することで、プラットフォームはアカウント乗っ取りや不正行為をより効果的に防止しつつ、機密性の高い操作に対するステップアップ認証のようなきめ細かなセキュリティポリシーを実装できます。

Enhance Security and Trust: New Session Metadata in Sign in with Google developers.googleblog.com

RSS Hunter • 6月16日

DiffusionGemma: 開発者ガイド

DiffusionGemmaは、Gemma 4アーキテクチャ上に構築された実験的なテキスト生成モデルであり、トークンごとの自己回帰ではなく拡散ベースの並列生成を使用しています。これにより、推論速度が大幅に向上し、双方向のコンテキスト認識とリアルタイムの自己修正が可能になり、コンシューマーGPUでのデプロイも可能になります。そのアーキテクチャは、反復的なノイズ除去を通じて256トークンのブロックを並列に生成および洗練するため、従来の言語モデルよりもSudokuのような複雑な制約ベースのタスクをより効果的に処理でき、ファインチューニングからの大幅な改善を示しています。このモデルはvLLMおよびその他の一般的な推論フレームワークと統合されており、開発者は高いパフォーマンス、効率的な長文コンテキストスケーリング、および簡単なカスタマイズとデプロイメントを組み合わせた新しい非自己回帰アプローチにアクセスできます。

DiffusionGemma: The Developer Guide developers.googleblog.com

RSS Hunter • 6月10日

Google Colab CLIのご紹介

Googleは、開発者やAIエージェントがローカルターミナルをリモートColabランタイムに接続し、シームレスな実行を可能にする新しいツール、Google Colab Command-Line Interface (CLI)を発表しました。この軽量CLIにより、ユーザーは高出力GPUを簡単にリクエストしたり、ローカルPythonスクリプトをリモートで実行したり、ファインチューニングされたGemma 3アダプターのようなアーティファクトログやモデルをシームレスに取得したりできます。標準的なターミナル環境に直接統合されることで、このツールは高度にプログラム可能であり、AntigravityやClaude CodeのようなAIエージェントが複雑な機械学習パイプラインを管理するために使用できるようになります。

Introducing the Google Colab CLI developers.googleblog.com

RSS Hunter • 6月5日

Gemma 4 12B: 開発者ガイド

新しくリリースされたGemma 4 12Bは、コンシューマーデバイスでの高性能なローカルAI実行のために設計された、密なマルチモーダルモデルです。新しいエンコーダーフリーアーキテクチャを導入することで、従来のビジュアルおよびオーディオエンコーダーをバイパスし、マルチモーダルデータを直接LLMバックボーンに供給します。

Gemma 4 12B: The Developer Guide developers.googleblog.com

RSS Hunter • 6月3日

ラップトップでGemma 4 12Bを動かす：Google AI Edgeによるローカル、エージェント型ワークフローの解放

Google DeepMindのGemma 4 12Bモデルは、16GBのRAMを搭載した一般的なラップトップにエージェント型、マルチモーダルAI機能をもたらし、ローカルデータ処理と視覚的な洞察生成を可能にします。ユーザーは、Google AI Edge Galleryを通じてmacOS上でこのモデルを活用し、動的なPythonコード実行と視覚化を行うことができます。また、Google AI Edge Eloquentを通じて、完全にオフラインでの音声ディクテーションとテキスト編集も可能です。さらに、LiteRT-LM CLIの新しいserveコマンドにより、開発者のワークフローが強化され、業界互換のローカルエンドポイントが作成され、完全にローカルなAIツールとエージェントを強化します。

Bringing Gemma 4 12B to your Laptop: Unlocking Local, Agentic Workflows with Google AI Edge developers.googleblog.com

RSS Hunter • 6月3日

コミュニティがTunixとTPUでGemmaに「思考」を訓練した方法

Kaggleで開催されたGoogle Tunix Hackathonは、開発者に対し、Kaggle TPUと限られたコンピューティング予算を使用して、小規模で推論能力のないベースモデルを汎用的な推論エンジンに変革することを課題としました。優勝チームは、Supervised Fine-Tuning（SFT）とGRPOやSimPOのような高度なアライメント技術を組み合わせたマルチステージのポストトレーニングパイプラインを実装することで、これを達成しました。最終的に、このコンペティションは、アクセス可能でオープンソースのリソースを使用して、コミュニティが高度な構造化推論モデルを成功裏にトレーニングできることを証明し、AI開発を民主化しました。

How the community trained Gemma to "Think" with Tunix and TPUs developers.googleblog.com

RSS Hunter • 5月28日

Google Pay & Wallet Developer MCPサーバーで統合ワークフローを強化しましょう

Googleは、AI開発アシスタントとIDEをリアルタイムのAPIおよびアカウントコンテキストに安全に接続するように設計されたオープンスタンダードツールである、新しいGoogle Pay & Wallet Developer MCPサーバーを発表しました。このサーバーにより、開発者は開発環境内に留まり、公式ドキュメントを検索したり、Walletパス定義を検証したり、統合ステータスを確認したり、マーチャントアカウントを管理したりすることができます。最終的に、この統合は、コンテキストスイッチングを最小限に抑え、最新の、根拠のあるAIサポートを提供することにより、摩擦を軽減し、開発ワークフローを加速することを目的としています。

Supercharge your integration workflow with the Google Pay & Wallet Developer MCP server developers.googleblog.com

RSS Hunter • 5月28日

Google Payの最新アップデート

Google Payは、Universal Commerce Protocolと、AIエージェントが統合を管理しトレンドを分析できる新しいMCPサーバーを導入することで、「エージェンティックコマース」へと進化しています。新しいAndroidアップデートでは、シームレスなエクスプレスチェックアウトのための動的なコールバックが導入され、WebViewを介してソーシャルメディアアプリへの支払いサポートが拡張されます。さらに、プラットフォームはクロスデバイスの生体認証と新しいトランザクションシグナルをローンチし、マーチャントが摩擦を軽減し、処理コストを最適化するのを支援します。

The latest updates to Google Pay developers.googleblog.com

RSS Hunter • 5月27日

Google Payにおける動的コールバックによるAndroidチェックアウトの強化

Google PayによるExpress checkoutをAndroidネイティブアプリで提供できることを嬉しく思います。これにより、開発者は…

Enhancing Android Checkout with Dynamic Callbacks in Google Pay developers.googleblog.com

RSS Hunter • 5月26日

Gemini for Homeによるサービスプロバイダーおよびハードウェアパートナーのエンパワーメント

Googleは、高度なカメラインテリジェンス、自然言語クエリ、日々の活動の要約を統合したフルスタックのGemini AIオファリングをローンチすることで、スマートホームエコシステムを拡大しています。この取り組みは、サービスプロバイダーやハードウェアメーカーに、ターンキーのリファレンスデザインとAPIを提供し、広範な研究開発なしにプロアクティブでブランド化されたサービスを構築できるようにします。最終的に、このプログラムは、基本的なデバイス制御を超えて、コンテキストを理解し、ユーザーのニーズにリアルタイムで対応できるAIネイティブなホームを目指しています。

Empowering Service Providers and Hardware Partners with Gemini for Home developers.googleblog.com

RSS Hunter • 5月21日

Kotlin向けADKおよびAndroid向けADK 0.1.0を発表：Androidおよびそれ以降でのAIエージェント構築

ADK for Kotlin は、バックエンドプロジェクトにエージェントワークフローをもたらし、ADK for Android は、スペ...

Announcing ADK for Kotlin and ADK for Android 0.1.0: Building AI Agents on Android and Beyond developers.googleblog.com

RSS Hunter • 5月21日

イノベーションの1年：Google Cloud x NVIDIA Developer Community 10万人のメンバーを祝して

Google CloudとNVIDIAの開発者コミュニティは、10万人のメンバーと共に1周年を祝っており、ビルダーに高度なAIインフラストラクチャとリソースを提供するという新たな重点を置いています。開発を加速するために、コミュニティはLLM最適化、GPUアクセラレーテッドデータ分析を習得するためのキュレーションされた学習パスと、毎月の専門家主導のウェビナーを提供しています。2年目に入るにあたり、このイニシアチブはハンズオンラボ、エンジニアリングイベント、そしてエージェンティックAIの成長に焦点を当てた専門コンテンツを含めるように拡大されます。

One Year of Innovation: Celebrating 100k Members in the Google Cloud x NVIDIA Developer Community developers.googleblog.com

RSS Hunter • 5月20日

Google I/O 2026 デベロッパー基調講演の全ニュース

Googleは、Gemini 3.5シリーズのローンチと、エージェントファースト開発プラットフォームAntigravityのメジャーアップデートを強調し、アシスタティブAIから独立型エージェントへの移行を発表しました。モバイル開発者向けには、新しいAndroid CLIツール、Android Bench評価リーダーボード、およびさまざまなフレームワークをネイティブKotlinコードに迅速に変換するように設計された自動移行エージェントが紹介されています。Web開発も、エージェント向けのChrome DevTools、HTML-in-Canvas API、そしてブラウザベースのAIエージェントが複雑なタスクを実行できるようにするオープンWeb標準であるWebMCPの提案によって変革されています。

All the news from the Google I/O 2026 Developer keynote developers.googleblog.com

RSS Hunter • 5月20日

Google Tensor SDK Beta with LiteRT

Google Tensor ML SDKがベータ版に移行し、開発者はGoogle Pixel 10デバイスのTPU上で直接高性能な機械学習モデルを構築・デプロイできるようになります。GoogleのエッジデプロイメントフレームワークであるLiteRTと統合することで、SDKは開発者がPyTorchまたはTFLiteモデルを変換、コンパイル、実行するための統一されたワークフローを、堅牢なフォールバックオプションとともに提供します。さらに、新しいモデルガーデンは、Gemma 3を含む100以上のクラシックおよび生成AIモデルを提供し、音声認識、コンピュータビジョン、テキスト生成などの低遅延でプライベートな機能を実現します。

Google Tensor SDK Beta with LiteRT developers.googleblog.com

RSS Hunter • 5月19日

LiteRT-LMによる超高速オンデバイスGenAI

Google AI Edge の LiteRT-LM は、Gemma 4 をクロスプラットフォームのモバイルおよびエッジ環境で実行するための、本番環境で実績のある高度に最適化されたインフラストラクチャを提供します。メモリ効率の高い動的ローディング、最大 2.2 倍の速度向上を実現する Multi-Token Prediction、および Thinking Mode や Constrained Decoding のような高度なオーケストレーションツールを活用することで、オンデバイスでモデルのネイティブなマルチモーダルおよびエージェンティック機能を積極的に解き放ちます。さらに、このエンジンは Android 以外の統合サーフェスを急速に拡大しており、Apple エコシステム向けの新しいネイティブ Swift API と、高性能なサーバーレスブラウザ推論のための WebGPU アクセラレーテッド JavaScript API を導入しています。

Blazing fast on-device GenAI with LiteRT-LM developers.googleblog.com

RSS Hunter • 5月19日

よりスマートなGoogle AIエッジギャラリー：MCP統合、通知、セッション継続

Google AI Edge Galleryアプリは、AndroidにおけるオープンソースのModel Context Protocol（MCP）の実験的サポートを導入し、オンデバイスAI機能を拡張しました。これにより、Gemma 4はGoogle WorkspaceやGoogle Mapsなどの外部データソースを横断する複雑なタスクを調整できるようになります。より積極的で持続的なユーザーインタラクションを可能にするため、今回のアップデートではルーチンを自動化するための「スケジュール通知」スキルと、長いセッションコンテキストをほぼ瞬時に復元する永続的なチャット履歴機能が追加されました。オープンソースツールキットによって推進されるこのプラットフォームは、コミュニティ開発者がGitHubリポジトリを通じてカスタムユーティリティ中心のワークフロー、プロンプト構成、ツール統合を構築・共有することを奨励しています。

A Smarter Google AI Edge Gallery: MCP integration, notifications, and session continuity developers.googleblog.com

RSS Hunter • 5月19日

重要なお知らせ：Gemini CLIからAntigravity CLIへの移行

Googleは、コミュニティ中心のGemini CLIを、複雑でマルチエージェントのワークフロー向けに構築された新しいエージェントファーストプラットフォームであるAntigravity CLIに移行することで、AIターミナルツールを統合しています。この新しいGoベースのツールは、より高速な実行、非同期処理、およびAntigravity 2.0デスクトップアプリケーションと同期する統一されたアーキテクチャを提供します。エンタープライズ顧客は既存のアクセスを維持しますが、個人および無料ユーザーは、Gemini CLIが2026年6月18日にリクエストの提供を停止する前に、新しいプラットフォームに移行する必要があります。

An important update: Transitioning Gemini CLI to Antigravity CLI developers.googleblog.com

RSS Hunter • 5月19日

Genkit Middlewareを発表：エージェント型アプリケーションをインターセプト、拡張、強化する

Genkitは、TypeScript、Go、Dart、Pythonを使用して、本番環境に対応したエージェンティックAIアプリケーションを開発するためのオープンソースフレームワークです。このフレームワークは、強力なミドルウェアシステムを利用しており、生成呼び出しをインターセプトして、リトライ、モデルフォールバック、人間参加型のツール承認などのカスタム動作を注入します。generate、model、toolレイヤーにフックをアタッチすることで、開発者はモデル出力に対する高い信頼性と決定論的な制御を確保できます。さらに、Genkitではカスタムミドルウェアの作成とスタッキングが可能であり、これらすべては専用のDeveloper UIを通じて検査およびデバッグできます。

Announcing Genkit Middleware: Intercept, extend, and harden your agentic apps developers.googleblog.com

RSS Hunter • 5月14日

オンデバイスAIの加速：ArmとGoogleのAIエッジ最適化について

Arm Scalable Matrix Extension 2 (SME2) と Google AI Edge ソフトウェアスタックの統合により、CPU を強力な行列計算アクセラレータに変換することで、高性能なオンデバイス生成 AI が可能になります。Stability AI の「stable-audio-open-small」モデルをケーススタディとして、LiteRT、XNNPACK、および KleidiAI を利用してハードウェアアクセラレーションを自動化する、合理化された「変換、最適化、およびデプロイ」パイプラインの概要を説明します。結果として実装されたものは、オーディオ生成で 2 倍以上の高速化とメモリ使用量で 4 倍の削減を達成し、Arm 搭載のモバイルデバイスおよびラップトップで高音質を維持します。

Accelerating on-device AI: A look at Arm and Google AI Edge optimization developers.googleblog.com

RSS Hunter • 5月14日

ADKで、一時停止、再開が可能で、コンテキストを失わない、長時間実行AIエージェントを構築する

ステートレスチャットボットから、HRオンボーディングのように数日または数週間に及ぶ長期的なエンタープライズワークフローを管理できる本番グレードのエージェントへの移行方法。エージェント開発キット（ADK）とそのアーキテクチャの変更を紹介し、特に耐久性のあるステートマシンと永続的なセッションストレージを使用して、エージェントが「アイドル時間」やサーバーの再起動中にコンテキストを失わないようにします。イベント駆動型のWebhookとマルチエージェントの委任を活用することで、チュートリアルでは、一時停止中に「スリープ」し、複雑なタスクを高い推論精度で再開するために「ウェイクアップ」する回復力のあるシステムを構築する方法を示します。

Build Long-running AI agents that pause, resume, and never lose context with ADK developers.googleblog.com

RSS Hunter • 5月12日

Google TPUでのLLM推論の超高速化：拡散モデル風の投機的デコーディングによる3倍の速度向上

UCSDの研究者は、Google TPU上でブロック拡散投機的デコーディング手法であるDFlashを実装し、従来の自己回帰ドラフトの逐次的なボトルネックを回避することに成功しました。トークン候補のブロック全体を一度に予測するのではなく、一度のフォワードパスで「ペイント」することで、システムは平均3.13倍の速度向上を達成し、ピーク性能はEAGLE-3のような既存の手法をほぼ2倍にしました。vLLMエコシステムへのこのオープンソース統合は、「無料」の並列検証と複雑な推論タスクのための高品質なドラフト予測を活用することで、TPUハードウェアを最適化します。

Supercharging LLM inference on Google TPUs: Achieving 3X speedups with diffusion-style speculative decoding developers.googleblog.com

RSS Hunter • 5月4日

Gemini Embedding 2 による構築：エージェント型マルチモーダル RAG とその先

Googleは、テキスト、画像、動画、音声、ドキュメントを単一のセマンティック空間にマッピングする統合モデルであるGemini Embedding 2の一般提供を発表しました。このモデルにより、開発者はインターリーブされたマルチモーダル入力を単一のリクエストで処理できるようになり、エージェンティックRAG、ビジュアル検索、コンテンツモデレーションなどのタスクのパフォーマンスが大幅に向上します。100以上の言語をサポートし、タスク固有のプレフィックスやマトリョーシュカ次元削減などの機能を提供することで、このモデルは複雑なAIエージェントを構築するための非常に効率的で正確な基盤を提供します。

Building with Gemini Embedding 2: Agentic multimodal RAG and beyond developers.googleblog.com

RSS Hunter • 4月30日

AIの高速化：GCSFSとRapid Bucketを使ってGoogle ColossusをPyTorchに導入

Google Cloud は、AI トレーニングのボトルネックを解消するため、fsspec インターフェースを介して Rapid Storage を PyTorch に直接接続する高性能な統合を導入しました。Google の Colossus アーキテクチャと双方向 gRPC ストリーミングを利用することで、このソリューションは最大 15 TiB/秒の集約スループットと、大幅なレイテンシの削減を実現します。これらの改善により、開発者はストレージバケットの種類を更新するだけで、コードを変更することなく、総トレーニング時間を 23% 短縮できます。

Speeding Up AI: Bringing Google Colossus to PyTorch via GCSFS and Rapid Bucket developers.googleblog.com

RSS Hunter • 4月29日

LiteRTとNPUを用いた実世界のオンデバイスAI構築

LiteRT は、モバイル開発者がニューラルプロセッシングユニット (NPU) の力を最大限に引き出し、従来の CPU や GPU 処理のパフォーマンスとバッテリーの制約を克服できるように設計された、実用的なフレームワークです。ハードウェアの複雑さを抽象化した統一された API を提供することで、Google Meet や Epic Games などの業界リーダーが、リアルタイムビデオ、アニメーション、音声認識のための洗練された AI モデルを、大幅に高い効率で展開することを可能にします。さらに、このプラットフォームは、ベンチマークツールとクロスプラットフォーム互換性を通じて開発者をサポートし、モバイルデバイス、AI PC、産業用 IoT ハードウェア全体でのシームレスな AI 展開を可能にします。

Building real-world on-device AI with LiteRT and NPU developers.googleblog.com

RSS Hunter • 4月24日

エージェントプラットフォームのCLI：1つのCLIで開発から本番まで

Google Cloud は、ローカル開発と本番環境レベルの AI エージェント展開の間のギャップを埋めるために設計された専門ツールである Agents CLI を導入しました。この CLI は、コーディングアシスタントに完全な Google Cloud スタックへの機械可読アクセスを提供し、スキャフォールディングプロセス中のコンテキストの過負荷とトークンの無駄を削減します。評価、インフラストラクチャのプロビジョニング、および展開を単一のプログラム可能なバックボーンに統合することで、このツールにより、開発者は初期のコンセプトからライブサービスまで、数週間ではなく数時間で移行できます。

Agents CLI in Agent Platform: create to production in one CLI developers.googleblog.com

RSS Hunter • 4月22日

本番環境対応のAIエージェント：モノリスのリファクタリングから学ぶ5つの教訓

このブログ記事は、GoogleのAgent Development Kit (ADK) を使用して、もろい販売調査プロトタイプを堅牢なプロダクションエージェントに移行させる過程を概説しています。モノリシックなスクリプトを、オーケストレーションされたサブエージェントと構造化されたPydantic出力に置き換えることで、開発者はサイレントフェイラーと脆弱なパースを排除しました。さらに、記事では、AIエージェントが現実世界のアプリケーションでスケーラブルで、費用対効果が高く、透明性を持つために、動的なRAGパイプラインとOpenTelemetryによる可観測性が不可欠であることを強調しています。

Production-Ready AI Agents: 5 Lessons from Refactoring a Monolith developers.googleblog.com

RSS Hunter • 4月21日

A2UI v0.9: ポータブルでフレームワークに依存しないジェネレーティブUIの新しいスタンダード

A2UI v0.9 は、AIエージェントが企業の既存のデザインシステムを使用して、リアルタイムでカスタマイズされたUIウィジェットを生成するのに役立つ、フレームワークに依存しない標準を導入しました。このアップデートは、Python用の新しいAgent SDK、共有Webコアライブラリ、React、Flutter、Angularなどのレンダラーの公式サポートにより、開発者エクスペリエンスを簡素化します。UIの意図を特定のプラットフォームから切り離すことで、このリリースは、Webおよびモバイルアプリケーション全体で、生成インターフェースのシームレスで低遅延のストリーミングを可能にします。AG2やVercelなどのより広範なエコシステムとの統合により、A2UI v0.9 は、生成UIを実験的なデモから、本番環境に対応したデジタル製品へと移行させることを目指しています。

A2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UI developers.googleblog.com

RSS Hunter • 4月17日

MaxText が事後学習機能を拡張：シングルホスト TPU 上での SFT と RL を導入

MaxText は、JAX と Tunix ライブラリを活用し、単一ホスト TPU 構成での教師ありファインチューニング (SFT) と強化学習 (RL) の新しいサポートを導入しました。これにより、高性能なモデルの洗練が可能になります。これらの機能により、開発者は、GRPO や GSPO などの効率的なアルゴリズムを使用して、事前学習済みのモデルを専門的なタスクや複雑な推論に簡単に適応させることができます。このアップデートは、ポストトレーニングワークフローを合理化し、単一ホスト構成からより大規模なマルチホスト構成へのスケーラブルなパスを提供します。

MaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUs developers.googleblog.com

RSS Hunter • 4月16日