RSS Google 개발자 블로그 팔로우 Developers.googleblog.com은 Google의 개발자들을 위한 공식 블로그입니다. 여기에서, 그들은 Google의 다양한 개발자 도구 및 기능, 버그 수정, 개발 기술 향상 튜토리얼에 대한 포괄적인 정보를 제공합니다. 블로그는 또한 Google의 소프트웨어 개발 프로젝트와 관련된 사례 연구, 인터뷰 및 커뮤니티 뉴스를 게시합니다. RSS developers.googleblog.com Google Developers Blog developers.googleblog.com
Google의 Agent Development Kit 및 A2A를 사용하여 언어 간 다중 에이전트 팀 구축 Python 에이전트와 Go 에이전트가 Agent2Agent 프로토콜을 사용하여 계약 준수를 협업하는 방법Y... Build Cross-Language Multi-Agent Team with Google’s Agent Development Kit and A2A developers.googleblog.com
줄스와 함께 중요한 것을 측정하다 AI 코딩 에이전트는 프롬프트 시 작업을 완료하는 수동적인 조수에서 빠르게 변화하고 있습니다... Measuring What Matters with Jules developers.googleblog.com
A2A가 협업 에이전트의 세계를 구축하는 방법 Agent-to-Agent(A2A) 프로토콜 출시 1주년을 기념하며, 이 블로그 게시물은 이 프레임워크가 어떻게 전통적인 API의 경직성 없이 자율 AI 에이전트가 안전하게 협업하고 작업을 인계할 수 있도록 하는지 강조합니다. 복잡한 워크플로우를 전문화된 피어 에이전트에게 위임함으로써, A2A는 컨텍스트 오염을 방지하고, 데이터 프라이버시를 보장하며, 모듈성을 통해 애플리케이션 설계를 단순화합니다. 이 생태계를 실제 작동하는 모습으로 보여주기 위해, 게시물은 생명 과학 분야의 에이전트 인터페이스인 FoldRun을 조명합니다. FoldRun은 복잡한 단백질 구조 예측을 조율하며, 상거래, 데이터 스트리밍, DevOps, 통신 전반에 걸친 다양한 A2A 사용 사례를 선보입니다. How A2A is Building a World of Collaborative Agents developers.googleblog.com
A2UI + MCP 앱: 선언형 및 맞춤형 에이전트 UI의 장점을 결합 이 게시물은 Model Context Protocol (MCP) 앱과 Agent-to-User Interface (A2UI)를 통합하기 위해 설계된 세 가지 아키텍처 패턴을 소개하며, 이는 고도로 맞춤화된 iframe 환경과 네이티브, 선언적 렌더링 간의 절충점을 해결합니다. 이러한 접근 방식을 결합함으로써 개발자는 MCP 서버를 통해 직접 네이티브와 같은 느낌의 UI를 제공하거나, 선언적 뷰 내에 복잡하고 상태적인 iframe 앱을 안전하게 포함시키거나, 레거시 시스템에 생성적 UI 구성 요소를 주입할 수 있습니다. 궁극적으로 이러한 하이브리드 프레임워크는 엔지니어링 팀이 특정 프로젝트 제약 조건에 맞춰 안전하고 성능이 뛰어나며 브랜드 일관성을 유지하는 에이전트형 사용자 경험을 제공할 수 있도록 지원합니다. A2UI + MCP Apps: Combining the best of declarative and custom agentic UIs developers.googleblog.com
Agentic Resource Discovery 사양 발표 웹 전반에 걸쳐 도구, 기술 및 에이전트를 찾고 검증하기 위한 개방형 사양입니다. 에이전트는... Announcing the Agentic Resource Discovery specification developers.googleblog.com
보안 및 신뢰 강화: Google 로그인에 새로운 세션 메타데이터 도입 Google은 개발자에게 더 깊은 세션 메타데이터를 제공하기 위해 새로운 OIDC 표준 클레임, 특히 auth_time 및 amr(Authentication Methods Reference)을 도입하여 Sign in with Google을 강화하고 있습니다. 이러한 업데이트를 통해 검증된 앱은 사용자의 로그인 "신선도"와 사용된 특정 인증 방법(예: MFA 또는 하드웨어 키)을 확인할 수 있어, 보다 동적이고 위험 기반의 액세스 제어가 가능해집니다. 이러한 연합 ID 신호를 활용함으로써 플랫폼은 계정 탈취 및 사기를 더 잘 방지하는 동시에 민감한 작업에 대한 단계별 인증과 같은 세분화된 보안 정책을 구현할 수 있습니다. Enhance Security and Trust: New Session Metadata in Sign in with Google developers.googleblog.com
TPU 스택의 힘을 열다: 새로운 개발자 허브 소개 Google이 모델 빌더와 개발자가 Google Cloud TPU의 성능을 극대화하도록 돕기 위해 설계된 중앙 집중식 교육 리소스인 TPU 개발자 허브를 공식 출시했습니다. 이 허브는 코드 우선 리소스, 오픈 소스 레시피, 하드웨어 아키텍처, 소프트웨어 최적화, 디버깅, 병렬 처리 및 네트워킹을 다루는 심층 문서 등을 제공합니다. 이러한 자료는 대규모 학습부터 저지연 추론 워크로드까지 모든 것을 간소화하기 위해 인간 개발자와 AI 지원 도구 모두에게 맞춰져 있습니다. Unlocking the Power of the TPU Stack: Introducing our new Developer Hub developers.googleblog.com
DiffusionGemma: 개발자 가이드 DiffusionGemma는 Gemma 4 아키텍처를 기반으로 구축된 실험적인 텍스트 생성 모델로, 토큰별 자기회귀 대신 확산 기반 병렬 생성을 사용하여 추론 속도를 훨씬 빠르게 하고, 양방향 컨텍스트 인식을 가능하게 하며, 실시간 자체 수정을 지원하면서도 소비자용 GPU에 배포할 수 있습니다. 이 아키텍처는 반복적인 노이즈 제거를 통해 256개 토큰 블록을 병렬로 생성하고 개선하여, 스도쿠와 같은 복잡한 제약 기반 작업을 기존 언어 모델보다 더 효과적으로 처리할 수 있게 하고 미세 조정을 통한 강력한 성능 향상을 보여줍니다. 이 모델은 vLLM 및 기타 인기 있는 추론 프레임워크와 통합되어 개발자들에게 고성능, 효율적인 긴 컨텍스트 확장, 그리고 간단한 사용자 정의 및 배포를 결합한 새로운 비자기회귀 접근 방식을 제공합니다. DiffusionGemma: The Developer Guide developers.googleblog.com
Google Colab CLI 소개 Google은 개발자와 AI 에이전트가 로컬 터미널을 원격 Colab 런타임에 연결하여 원활하게 실행할 수 있도록 하는 새로운 도구인 Google Colab Command-Line Interface(CLI)를 발표했습니다. 이 경량 CLI를 통해 사용자는 고성능 GPU를 쉽게 요청하고, 로컬 Python 스크립트를 원격으로 실행하며, fine-tuned Gemma 3 어댑터와 같은 아티팩트 로그 또는 모델을 원활하게 검색할 수 있습니다. 표준 터미널 환경에 직접 통합함으로써 이 도구는 프로그래밍 가능성이 높으며 Antigravity 또는 Claude Code와 같은 AI 에이전트가 복잡한 머신러닝 파이프라인을 관리하는 데 사용할 준비가 되어 있습니다. Introducing the Google Colab CLI developers.googleblog.com
Google AI Edge를 사용하여 노트북에서 Gemma 4 12B를 실행하고 로컬 에이전트 워크플로우를 활용하는 방법 Google DeepMind의 Gemma 4 12B 모델은 16GB RAM을 갖춘 일반 노트북에 에이전트 기반의 멀티모달 AI 기능을 제공하여 로컬 데이터 처리 및 시각적 인사이트 생성을 가능하게 합니다. 사용자는 Google AI Edge Gallery를 통해 macOS에서 이 모델을 활용하여 동적인 Python 코드 실행 및 시각화를 할 수 있으며, Google AI Edge Eloquent를 통해 완전히 오프라인 상태에서 음성 받아쓰기 및 텍스트 편집도 가능합니다. 또한, LiteRT-LM CLI의 새로운 serve 명령어를 통해 개발자 워크플로우가 향상되어, 완전 로컬 AI 도구 및 에이전트를 구동하기 위한 업계 호환 로컬 엔드포인트를 생성할 수 있습니다. Bringing Gemma 4 12B to your Laptop: Unlocking Local, Agentic Workflows with Google AI Edge developers.googleblog.com
Gemma 4 12B: 개발자 가이드 새롭게 출시된 Gemma 4 12B는 소비자 기기에서 고성능 로컬 AI 실행을 위해 설계된 밀집형 멀티모달 모델입니다. 새로운 인코더 없는 아키텍처를 도입하여, 전통적인 시각 및 오디오 인코더를 우회하고 멀티모달 데이터를 LLM 백본에 직접 공급합니다. Gemma 4 12B: The Developer Guide developers.googleblog.com
"커뮤니티가 Tunix와 TPU를 사용하여 Gemma를 "생각"하도록 훈련시킨 방법" Kaggle에서 열린 Google Tunix Hackathon은 개발자들에게 작고 추론 능력이 없는 기본 모델을 Kaggle TPU와 제한된 컴퓨팅 예산을 사용하여 일반 추론 엔진으로 변환하도록 도전했습니다. 우승팀은 지도 미세 조정(SFT)과 GRPO 및 SimPO와 같은 고급 정렬 기법을 결합한 다단계 사후 훈련 파이프라인을 구현하여 이를 달성했습니다. 궁극적으로 이 대회는 커뮤니티가 접근 가능하고 오픈 소스 리소스를 사용하여 매우 유능하고 구조화된 추론 모델을 성공적으로 훈련할 수 있음을 증명함으로써 AI 개발을 민주화했습니다. How the community trained Gemma to "Think" with Tunix and TPUs developers.googleblog.com
Google Pay & Wallet 개발자 MCP 서버로 통합 워크플로우를 강화하세요 Google은 AI 개발 보조 도구와 IDE를 실시간 API 및 계정 컨텍스트와 안전하게 연결하도록 설계된 개방형 표준 도구인 새로운 Google Pay & Wallet 개발자 MCP 서버를 발표했습니다. 이 서버를 통해 개발자는 개발 환경 내에서 공식 문서를 검색하고, Wallet 패스 정의를 검증하고, 통합 상태를 확인하고, 판매자 계정을 관리할 수 있습니다. 궁극적으로 이 통합은 컨텍스트 전환을 최소화하고 최신 정보를 기반으로 한 AI 지원을 제공함으로써 마찰을 줄이고 개발 워크플로우를 가속화하는 것을 목표로 합니다. Supercharge your integration workflow with the Google Pay & Wallet Developer MCP server developers.googleblog.com
Google Pay의 최신 업데이트 Google Pay는 Universal Commerce Protocol과 AI 에이전트가 통합을 관리하고 트렌드를 분석할 수 있도록 하는 새로운 MCP 서버를 도입하여 "에이전트 기반 커머스"를 위해 진화하고 있습니다. 새로운 Android 업데이트는 원활한 익스프레스 체크아웃을 위한 동적 콜백을 도입하고 WebView를 통해 소셜 미디어 앱으로 결제 지원을 확장합니다. 또한, 플랫폼은 교차 기기 생체 인증과 새로운 거래 신호를 출시하여 판매자가 마찰을 줄이고 처리 비용을 최적화하도록 지원합니다. The latest updates to Google Pay developers.googleblog.com
Google Pay에서 동적 콜백을 이용한 Android 결제 기능 강화 저희는 개발자를 위해 Android 네이티브 앱에서 Google Pay를 통한 Express checkout을 선보이게 되어 기쁩니다... Enhancing Android Checkout with Dynamic Callbacks in Google Pay developers.googleblog.com
Gemini for Home로 서비스 제공업체 및 하드웨어 파트너 역량 강화 Google은 고급 카메라 인텔리전스, 자연어 쿼리 및 일일 활동 요약을 통합하는 풀스택 Gemini AI 오퍼링을 출시하여 스마트 홈 생태계를 확장하고 있습니다. 이 이니셔티브는 서비스 제공업체와 하드웨어 제조업체에게 광범위한 연구 개발 없이도 선제적이고 브랜드화된 서비스를 구축할 수 있는 턴키 레퍼런스 디자인과 API를 제공합니다. 궁극적으로 이 프로그램은 기본적인 장치 제어를 넘어 맥락을 이해하고 실시간으로 사용자의 요구를 돌볼 수 있는 AI 네이티브 홈으로 나아가는 것을 목표로 합니다. Empowering Service Providers and Hardware Partners with Gemini for Home developers.googleblog.com
Kotlin용 ADK 및 Android용 ADK 0.1.0 발표: Android 및 그 이상에서 AI 에이전트 구축 ADK for Kotlin은 백엔드 프로젝트에 에이전트 워크플로우를 제공하며, ADK for Android는 spe... Announcing ADK for Kotlin and ADK for Android 0.1.0: Building AI Agents on Android and Beyond developers.googleblog.com
Google I/O 2026 개발자 키노트의 모든 뉴스 Google은 Gemini 3.5 시리즈 출시와 Antigravity 에이전트 우선 개발 플랫폼의 주요 업데이트를 강조하며, 보조 AI에서 독립 에이전트로의 전환을 발표했습니다. 모바일 개발자를 위해, 이 게시물은 새로운 Android CLI 도구, Android Bench 평가 리더보드, 그리고 다양한 프레임워크를 네이티브 Kotlin 코드로 신속하게 변환하도록 설계된 자동화된 Migration 에이전트를 소개합니다. 웹 개발 또한 에이전트용 Chrome DevTools, HTML-in-Canvas API, 그리고 브라우저 기반 AI 에이전트가 복잡한 작업을 실행할 수 있도록 하는 개방형 웹 표준인 WebMCP 제안을 통해 변화하고 있습니다. All the news from the Google I/O 2026 Developer keynote developers.googleblog.com
혁신의 1년: Google Cloud x NVIDIA 개발자 커뮤니티 10만 회원 달성 기념 Google Cloud와 NVIDIA 개발자 커뮤니티가 10만 명의 회원과 함께 첫 번째 생일을 기념하며, 빌더들에게 고급 AI 인프라 및 리소스를 제공하는 데 중점을 두고 있습니다. 개발을 가속화하기 위해 커뮤니티는 LLM 최적화, GPU 가속 데이터 분석을 마스터하기 위한 큐레이션된 학습 경로와 월별 전문가 주도 웨비나를 제공합니다. 두 번째 해를 맞이하여 이 이니셔티브는 실습 실험실, 엔지니어링 이벤트 및 에이전트 AI 성장에 초점을 맞춘 전문 콘텐츠를 포함하도록 확장될 것입니다. One Year of Innovation: Celebrating 100k Members in the Google Cloud x NVIDIA Developer Community developers.googleblog.com
중요 업데이트: Gemini CLI를 Antigravity CLI로 전환 Google은 커뮤니티 중심의 Gemini CLI를 복잡하고 다중 에이전트 워크플로우를 위해 구축된 새로운 에이전트 우선 플랫폼인 Antigravity CLI로 전환하여 AI 터미널 도구를 통합하고 있습니다. 이 새로운 Go 기반 도구는 더 빠른 실행, 비동기 처리, 그리고 Antigravity 2.0 데스크톱 애플리케이션과 동기화되는 통합 아키텍처를 제공합니다. 기업 고객은 기존 액세스를 유지하지만, 개인 및 무료 사용자는 Gemini CLI가 2026년 6월 18일에 요청 처리를 중단하기 전에 새로운 플랫폼으로 전환해야 합니다. An important update: Transitioning Gemini CLI to Antigravity CLI developers.googleblog.com
더 스마트한 Google AI 엣지 갤러리: MCP 통합, 알림 및 세션 연속성 Google AI Edge Gallery 앱은 Android에서 오픈 소스 Model Context Protocol(MCP)에 대한 실험적 지원을 도입하여 온디바이스 AI 기능을 확장했으며, 이를 통해 Gemma 4는 Google Workspace 및 Google Maps와 같은 외부 데이터 소스 전반에 걸쳐 복잡한 작업을 조정할 수 있습니다. 보다 능동적이고 지속적인 사용자 상호 작용을 가능하게 하기 위해 업데이트에는 루틴 자동화를 위한 "Schedule Notification" 스킬과 거의 즉시 긴 세션 컨텍스트를 복원하는 지속적인 채팅 기록 기능이 추가되었습니다. 오픈 소스 툴킷에 의해 구동되는 이 플랫폼은 커뮤니티 개발자가 GitHub 리포지토리를 통해 맞춤형 유틸리티 중심 워크플로, 프롬프트 구성 및 도구 통합을 구축하고 공유하도록 장려합니다. A Smarter Google AI Edge Gallery: MCP integration, notifications, and session continuity developers.googleblog.com
Google Tensor SDK Beta with LiteRT Google Tensor ML SDK가 베타 단계로 전환되어, 개발자들은 Google Pixel 10 기기의 TPU에 직접 고성능 머신러닝 모델을 구축하고 배포할 수 있게 되었습니다. Google의 엣지 배포 프레임워크인 LiteRT와 통합함으로써, SDK는 개발자들이 PyTorch 또는 TFLite 모델을 변환, 컴파일 및 실행할 수 있는 통합 워크플로우를 제공하며 강력한 폴백 옵션을 지원합니다. 또한, 새로운 모델 가든은 Gemma 3를 포함한 100개 이상의 클래식 및 생성형 AI 모델을 제공하여 음성 인식, 컴퓨터 비전, 텍스트 생성과 같은 저지연, 개인 정보 보호 기능을 가능하게 합니다. Google Tensor SDK Beta with LiteRT developers.googleblog.com
LiteRT-LM으로 초고속 온디바이스 GenAI Google AI Edge의 LiteRT-LM은 Gemma 4를 크로스 플랫폼 모바일 및 엣지 환경에서 실행하기 위한 프로덕션 검증된 고도로 최적화된 인프라를 제공합니다. 메모리 효율적인 동적 로딩, 최대 2.2배의 속도 향상을 위한 Multi-Token Prediction, 그리고 Thinking Mode 및 Constrained Decoding과 같은 고급 오케스트레이션 도구를 활용하여 온디바이스에서 모델의 네이티브 멀티모달 및 에이전트 기능을 적극적으로 활성화합니다. 또한, 이 엔진은 Android를 넘어 통합 표면을 빠르게 확장하고 있으며, Apple 생태계를 위한 새로운 네이티브 Swift API와 고성능 서버리스 브라우저 추론을 위한 WebGPU 가속 JavaScript API를 도입하고 있습니다. Blazing fast on-device GenAI with LiteRT-LM developers.googleblog.com
Genkit 미들웨어 발표: 에이전트 앱 가로채기, 확장 및 강화 Genkit는 개발자가 TypeScript, Go, Dart 및 Python을 사용하여 프로덕션 준비가 된 에이전트 AI 애플리케이션을 구축하도록 돕기 위해 설계된 오픈 소스 프레임워크입니다. 이 프레임워크는 재시도, 모델 대체, 인간 루프 도구 승인과 같은 사용자 정의 동작을 주입하기 위해 생성 호출을 가로채는 강력한 미들웨어 시스템을 활용합니다. 생성, 모델 및 도구 계층에 후크를 연결함으로써 개발자는 모델 출력에 대한 높은 안정성과 결정론적 제어를 보장할 수 있습니다. 또한 Genkit는 사용자 정의 미들웨어를 생성하고 스택할 수 있으며, 이 모든 것은 전용 개발자 UI를 통해 검사하고 디버깅할 수 있습니다. Announcing Genkit Middleware: Intercept, extend, and harden your agentic apps developers.googleblog.com
온디바이스 AI 가속화: Arm과 Google의 AI 엣지 최적화 살펴보기 Arm Scalable Matrix Extension 2 (SME2)와 Google AI Edge 소프트웨어 스택의 통합은 CPU를 강력한 행렬 연산 가속기로 전환하여 고성능의 온디바이스 생성형 AI를 가능하게 합니다. Stability AI의 "stable-audio-open-small" 모델을 사례 연구로 사용하여, LiteRT, XNNPACK, KleidiAI를 활용하여 하드웨어 가속을 자동화하는 간소화된 "변환, 최적화 및 배포" 파이프라인을 개략적으로 설명합니다. 결과적인 구현은 오디오 생성 속도를 2배 이상 향상시키고 메모리 사용량을 4배 줄이는 동시에 Arm 기반 모바일 장치 및 노트북에서 높은 오디오 품질을 유지합니다. Accelerating on-device AI: A look at Arm and Google AI Edge optimization developers.googleblog.com
ADK로 일시 중지, 재개 가능하며 컨텍스트를 잃지 않는 장기 실행 AI 에이전트를 구축하세요. "HR 온보딩과 같이 며칠 또는 몇 주에 걸쳐 진행되는 장기 엔터프라이즈 워크플로우를 관리할 수 있는 스테이트리스 챗봇에서 프로덕션 등급 에이전트로 전환하는 방법. 에이전트 개발 키트(ADK)와 그 아키텍처 변경 사항을 소개하며, 특히 내구성이 뛰어난 상태 기계와 영구 세션 스토리지를 사용하여 에이전트가 "유휴 시간" 또는 서버 재시작 중에 컨텍스트를 절대 잃지 않도록 합니다. 이벤트 기반 웹훅과 다중 에이전트 위임을 활용하여, 일시 중지 중에 "잠들었다가" 복잡한 작업을 높은 추론 정확도로 재개하기 위해 깨어나는 복원력 있는 시스템을 구축하는 방법을 보여줍니다." Build Long-running AI agents that pause, resume, and never lose context with ADK developers.googleblog.com
Google TPU에서 LLM 추론 성능 극대화: 확산 스타일 추측 디코딩으로 3배 속도 향상 달성 UCSD의 연구원들은 Google TPU에 블록 확산 추측 디코딩 방법인 DFlash를 성공적으로 구현하여 기존의 자기회귀 초안 작성의 순차적 병목 현상을 우회했습니다. 한 번의 순방향 패스로 후보 토큰의 전체 블록을 하나씩 예측하는 대신 "페인팅"함으로써, 시스템은 평균 3.13배의 속도 향상을 달성했으며, 최고 성능은 EAGLE-3과 같은 기존 방법의 거의 두 배에 달했습니다. vLLM 생태계에 대한 이 오픈 소스 통합은 "무료" 병렬 검증과 복잡한 추론 작업을 위한 고품질 초안 예측을 활용하여 TPU 하드웨어를 최적화합니다. Supercharging LLM inference on Google TPUs: Achieving 3X speedups with diffusion-style speculative decoding developers.googleblog.com
Gemini Embedding 2로 구축하기: 에이전트 기반 멀티모달 RAG 및 그 이상 Google이 텍스트, 이미지, 비디오, 오디오 및 문서를 단일 의미 공간으로 매핑하는 통합 모델인 Gemini Embedding 2의 일반 출시를 발표했습니다. 이 모델을 통해 개발자는 단일 요청으로 인터리브된 멀티모달 입력을 처리할 수 있어 에이전트 RAG, 시각적 검색 및 콘텐츠 조정과 같은 작업의 성능을 크게 향상시킬 수 있습니다. 100개 이상의 언어를 지원하고 작업별 접두사 및 Matryoshka 차원 축소와 같은 기능을 제공함으로써 이 모델은 복잡한 AI 에이전트를 구축하기 위한 매우 효율적이고 정확한 기반을 제공합니다. Building with Gemini Embedding 2: Agentic multimodal RAG and beyond developers.googleblog.com
AI 속도 향상: GCSFS와 Rapid Bucket을 통해 Google Colossus를 PyTorch에 도입 구글 클라우드는 AI 훈련 병목 현상을 제거하기 위해 Rapid Storage를 fsspec 인터페이스를 통해 PyTorch에 직접 연결하는 고성능 통합 기능을 도입했습니다. 구글의 Colossus 아키텍처와 양방향 gRPC 스트리밍을 활용하여 이 솔루션은 최대 15 TiB/s의 집계 처리량과 상당한 지연 시간 감소를 제공합니다. 이러한 개선 사항을 통해 개발자는 스토리지 버킷 유형을 업데이트하는 것 외에 코드 변경 없이 총 훈련 시간을 23%까지 단축할 수 있습니다. Speeding Up AI: Bringing Google Colossus to PyTorch via GCSFS and Rapid Bucket developers.googleblog.com
LiteRT와 NPU를 이용한 실제 기기 내 AI 구축 LiteRT는 모바일 개발자가 신경망 처리 장치(NPU)의 성능을 최대한 활용할 수 있도록 설계된 실용적인 프레임워크입니다. 이는 기존 CPU 또는 GPU 처리 방식의 성능 및 배터리 제약 사항을 극복하는 데 도움을 줍니다. 하드웨어 복잡성을 추상화하는 통합 API를 제공함으로써, Google Meet 및 Epic Games와 같은 업계 선두 기업들이 실시간 비디오, 애니메이션, 음성 인식과 같은 정교한 AI 모델을 훨씬 더 효율적으로 배포할 수 있도록 지원합니다. 또한, 이 플랫폼은 벤치마킹 도구 및 크로스 플랫폼 호환성을 통해 개발자를 지원하여 모바일 기기, AI PC, 산업용 IoT 하드웨어 전반에 걸쳐 원활한 AI 배포를 가능하게 합니다. Building real-world on-device AI with LiteRT and NPU developers.googleblog.com
Agent Platform의 Agents CLI: 하나의 CLI로 개발부터 프로덕션까지 Google Cloud가 로컬 개발과 프로덕션 수준의 AI 에이전트 배포 간의 격차를 해소하기 위해 설계된 전문 도구인 Agents CLI를 출시했습니다. 이 CLI는 코딩 도우미에게 전체 Google Cloud 스택에 대한 기계 판독 가능한 액세스를 제공하여 스캐폴딩 과정에서 컨텍스트 과부하와 토큰 낭비를 줄입니다. 평가, 인프라 프로비저닝 및 배포를 단일 프로그래밍 백본으로 간소화함으로써 이 도구를 통해 개발자는 초기 개념에서 라이브 서비스까지 몇 주가 아닌 몇 시간 만에 전환할 수 있습니다. Agents CLI in Agent Platform: create to production in one CLI developers.googleblog.com
프로덕션 레디 AI 에이전트: 모놀리스 리팩토링에서 얻은 5가지 교훈 이 블로그 게시물은 불안정한 판매 연구 프로토타입을 Google의 에이전트 개발 키트(ADK)를 사용하여 강력한 프로덕션 에이전트로 전환하는 과정을 설명합니다. 개발자들은 모놀리식 스크립트를 오케스트레이션된 하위 에이전트와 구조화된 Pydantic 출력으로 대체함으로써, 조용한 실패와 취약한 파싱을 제거했습니다. 또한, 이 게시물은 AI 에이전트가 실제 애플리케이션에서 확장 가능하고, 비용 효율적이며, 투명성을 확보하기 위해 동적 RAG 파이프라인과 OpenTelemetry 관측 가능성이 필수적임을 강조합니다. Production-Ready AI Agents: 5 Lessons from Refactoring a Monolith developers.googleblog.com
A2UI v0.9: 휴대용, 프레임워크 독립적인 생성형 UI의 새로운 표준 A2UI v0.9는 AI 에이전트가 회사의 기존 디자인 시스템을 사용하여 실시간으로 맞춤형 UI 위젯을 생성할 수 있도록 설계된 프레임워크 독립적인 표준을 도입합니다. 이번 업데이트는 새로운 Python용 Agent SDK, 공유 웹 코어 라이브러리, React, Flutter, Angular와 같은 렌더러에 대한 공식 지원을 통해 개발자 경험을 단순화합니다. UI 의도를 특정 플랫폼에서 분리함으로써, 이 릴리스는 웹 및 모바일 애플리케이션 전반에서 생성적 인터페이스의 원활하고 낮은 지연 시간 스트리밍을 가능하게 합니다. AG2 및 Vercel과 같은 더 넓은 생태계와 통합하여, A2UI v0.9는 생성적 UI를 실험적인 데모에서 프로덕션 준비가 된 디지털 제품으로 전환하는 것을 목표로 합니다. A2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UI developers.googleblog.com
MaxText, 학습 후 기능 확장: 단일 호스트 TPU에서 SFT 및 RL 도입 MaxText는 JAX와 Tunix 라이브러리를 활용하여 단일 호스트 TPU 구성에서 지도 미세 조정(SFT) 및 강화 학습(RL)에 대한 새로운 지원을 도입했습니다. 이를 통해 개발자는 GRPO 및 GSPO와 같은 효율적인 알고리즘을 사용하여 사전 훈련된 모델을 전문적인 작업과 복잡한 추론에 쉽게 적용할 수 있습니다. 이 업데이트는 후속 훈련 워크플로우를 간소화하여 단일 호스트 설정에서 더 큰 멀티 호스트 구성으로 확장 가능한 경로를 제공합니다. MaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUs developers.googleblog.com
Google Pay API를 통한 판매자 주도 거래를 위한 새로운 기능 Google은 판매자 주도 거래(MIT)에 대한 개발자의 유연성과 제어력을 높이기 위해 Google Pay API를 개선했습니다. 이번 업데이트에는 반복 구독, 호텔 예약과 같은 연기된 결제, 자동 계정 충전을 처리하기 위한 PaymentDataRequest 내의 새로운 객체가 포함됩니다. 판매자가 향후 결제 조건을 명확하게 정의할 수 있도록 함으로써 이러한 변경 사항은 사용자에게 투명성을 높이고 토큰 관리를 개선하여 거래 거부를 줄이는 데 도움이 됩니다. 개발자는 이제 이러한 기능을 구현하여 더욱 원활하고 안전한 장기 결제 경험을 만들 수 있습니다. New enhancements for merchant initiated transactions with the Google Pay API developers.googleblog.com
Gemini CLI에 서브 에이전트가 도착했습니다. "Gemini CLI에 하위 에이전트가 도입되었습니다. 하위 에이전트는 복잡하거나 대량의 작업을 격리된 컨텍스트 창에서 처리하여 기본 세션을 빠르고 집중적으로 유지하는 전문 에이전트입니다. 이러한 에이전트는 Markdown 파일을 통해 사용자 정의할 수 있고, 병렬로 실행하여 생산성을 높일 수 있으며, 대상 위임을 위해 @agent 구문을 사용하여 쉽게 호출할 수 있습니다. 이 아키텍처는 복잡한 다단계 실행을 간결한 요약으로 통합하여 기본 오케스트레이터에 대한 "컨텍스트 부패"를 방지합니다." Subagents have arrived in Gemini CLI developers.googleblog.com
Google I/O 준비하세요: 라이브 스트리밍 일정 공개 구글 I/O가 5월 19일부터 20일까지 다시 열립니다. 이번 행사에서는 AI, 안드로이드, 크롬, 클라우드 분야의 주요 업데이트를 선보일 예정이며, "에이전트 시대"의 개발을 주제로 한 기조 연설로 시작합니다. 이번 행사는 복잡한 워크플로우를 자동화하고 고품질의 AI 지원 애플리케이션 제작을 간소화하도록 설계된 새로운 도구에 초점을 맞출 것입니다. 참가자들은 라이브 세션, 기술 데모, 전문성 개발 자료를 라이브 및 주문형으로 이용할 수 있도록 등록할 수 있습니다. Get ready for Google I/O: Livestream schedule revealed developers.googleblog.com
더 나은 AI 에이전트 구축하기: 에이전트 베이크오프에서 얻은 5가지 개발자 팁 구글 클라우드 AI 에이전트 베이크 오프는 단순한 프롬프트 엔지니어링에서 엄격한 에이전트 엔지니어링으로의 전환을 강조하며, 프로덕션 준비가 된 AI는 모듈형, 다중 에이전트 아키텍처를 필요로 함을 강조합니다. 이 게시물은 다섯 가지 주요 개발자 팁을 제시하는데, 복잡한 작업을 전문화된 하위 에이전트로 분해하고, 확률적 오류를 방지하기 위해 결정론적 코드를 실행에 사용하는 것을 포함합니다. 또한, 개발자들에게 에이전트의 확장성, 통합성, 그리고 빠르게 발전하는 모델 기능에 대한 미래 보장을 위해 멀티모달리티와 MCP와 같은 오픈 소스 프로토콜을 우선적으로 고려할 것을 권고합니다. Build Better AI Agents: 5 Developer Tips from the Agent Bake-Off developers.googleblog.com
TorchTPU: 구글 규모에서 PyTorch를 TPU에서 네이티브로 실행하기 TorchTPU는 Google의 TPU 인프라에서 PyTorch 워크로드를 실행하기 위한 네이티브 고성능 경험을 제공하도록 설계된 새로운 엔지니어링 스택입니다. 최소한의 코드 변경만으로 가능합니다. 'Eager First' 접근 방식을 특징으로 하며, 여러 실행 모드를 지원하고, XLA 컴파일러를 활용하여 대규모 클러스터에서 분산 학습을 최적화합니다. 2026년까지 이 프로젝트는 컴파일 오버헤드를 더욱 줄이고, 동적 형상 및 사용자 정의 커널에 대한 지원을 확대하여 차세대 AI를 위한 원활한 확장성을 보장하는 것을 목표로 합니다. TorchTPU: Running PyTorch Natively on TPUs at Google Scale developers.googleblog.com
앱에서 Google 계정 사용자 이름 변경 지원 구글이 미국 사용자들을 대상으로 기존 계정 데이터와 받은 편지함을 그대로 유지하면서 @gmail.com 사용자 이름을 변경할 수 있도록 계정 설정을 업데이트했습니다. 개발자들에게는, 기존 이메일 주소가 별칭으로 계속 활성화되는 반면, 이메일 주소에만 의존하여 사용자 식별을 하는 앱은 계정 중복 또는 접근 손실과 같은 문제에 직면할 수 있다는 의미입니다. 원활한 사용자 경험을 보장하기 위해, 구글은 "주제 ID"를 주요 사용자 식별자로 이전하고, 사용자가 앱 설정 내에서 연락처 정보를 수동으로 업데이트할 수 있도록 권장합니다. Supporting Google Account username change in your app developers.googleblog.com
Gemma 4로 최첨단 에이전트 기술을 엣지 디바이스에 적용하세요. "Google DeepMind가 최첨단 오픈 모델인 Gemma 4를 출시했습니다. 이 모델은 온디바이스에서 직접 다단계 계획 및 자율 에이전트 워크플로우를 지원하도록 설계되었습니다. 이번 출시에는 "에이전트 스킬"을 실험할 수 있는 Google AI Edge Gallery와 개발자에게 상당한 속도 향상 및 구조화된 출력을 제공하는 LiteRT-LM 라이브러리가 포함됩니다. Apache 2.0 라이선스로 제공되는 Gemma 4는 140개 이상의 언어를 지원하며 Raspberry Pi와 같은 모바일 장치, 데스크톱 및 IoT 플랫폼을 포함한 광범위한 하드웨어와 호환됩니다." Bring state-of-the-art agentic skills to the edge with Gemma 4 developers.googleblog.com
스킬을 활용한 ADK 에이전트 구축 개발자 가이드 에이전트 개발 키트(ADK) 스킬툴셋은 "점진적 공개" 아키텍처를 도입하여 AI 에이전트가 필요에 따라 도메인 전문 지식을 로드할 수 있도록 합니다. 이를 통해 기존의 단일형 프롬프트에 비해 토큰 사용량을 최대 90%까지 줄일 수 있습니다. 간단한 인라인 체크리스트부터 에이전트가 직접 코드를 작성하는 "스킬 팩토리"에 이르기까지 네 가지 뚜렷한 패턴을 통해 이 시스템은 에이전트가 범용 agentskills.io 사양을 사용하여 런타임에 자신의 기능을 동적으로 확장할 수 있도록 합니다. 이러한 모듈식 접근 방식은 복잡한 지침과 외부 리소스가 관련성이 있을 때만 액세스되도록 보장하여 현대 AI 개발을 위한 확장 가능하고 자체 확장 가능한 프레임워크를 만듭니다. Developer’s Guide to Building ADK Agents with Skills developers.googleblog.com
Orbax와 MaxText에서 지속적인 체크포인팅을 통해 신뢰성을 최적화하여 훈련 처리량을 향상시키는 방법 Orbax와 MaxText에 새로 도입된 연속 체크포인팅 기능은 모델 학습 중 안정성과 성능 간의 균형을 최적화하도록 설계되었으며, 기존의 고정 빈도 체크포인팅 문제를 해결합니다. 안정성을 저해하거나 성능을 병목 현상으로 만들 수 있는 고정 간격과 달리, 연속 체크포인팅은 이전 저장 작업이 성공적으로 완료된 후에만 비동기적으로 새로운 저장 작업을 시작하여 I/O 대역폭을 최대화하고 실패 위험을 최소화합니다. 벤치마크 결과에 따르면 이 접근 방식은 체크포인트 간격을 크게 줄이고, 특히 평균 고장 간격(MTBF)이 짧은 대규모 학습 작업에서 상당한 리소스 절약을 가져옵니다. Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and MaxText developers.googleblog.com
ADK Go 1.0 출시! "Go 1.0용 Agent Development Kit(ADK)의 출시는 관찰 가능성, 보안 및 확장성을 우선시하여 실험적인 AI 스크립트에서 프로덕션 준비 서비스로의 중요한 전환을 의미합니다. 주요 업데이트에는 심층 추적을 위한 네이티브 OpenTelemetry 통합, 자체 복구 논드를 위한 새로운 플러그인 시스템, 민감한 작업 중 안전을 보장하기 위한 "Human-in-the-Loop" 확인이 포함됩니다. 또한 이 릴리스는 빠른 반복을 위한 YAML 기반 구성과 다양한 프로그래밍 언어 간의 원활한 통신을 지원하기 위한 개선된 Agent2Agent(A2A) 프로토콜을 도입합니다. 이 프레임워크는 개발자가 Golang의 고성능 엔지니어링 표준을 사용하여 복잡하고 안정적인 다중 에이전트 시스템을 구축할 수 있도록 지원합니다." ADK Go 1.0 Arrives! developers.googleblog.com
자바용 ADK 1.0.0 발표: 자바 기반 AI 에이전트의 미래를 건설하다 구글은 Java용 에이전트 개발 키트(ADK) 버전 1.0.0을 출시했습니다. 이 버전은 Google 지도 연동, 내장 URL 가져오기 기능, 그리고 프레임워크 간 협업을 위한 표준화된 Agent2Agent 프로토콜과 같은 강력한 새로운 기능을 도입했습니다. 이번 업데이트는 새로운 "App" 및 "Plugin" 아키텍처를 통해 에이전트 제어를 강화합니다. 이 아키텍처는 전역 로깅, 이벤트 압축을 통한 자동 컨텍스트 창 관리, 그리고 액션 확인을 위한 "Human-in-the-Loop" 워크플로우를 가능하게 합니다. 또한, 이번 릴리스는 Firestore 및 Vertex AI와 같은 Google Cloud 통합을 사용하여 장기적인 상태와 대규모 데이터 아티팩트를 관리하기 위한 강력한 세션 및 메모리 서비스를 제공합니다. Announcing ADK for Java 1.0.0: Building the Future of AI Agents in Java developers.googleblog.com
상담원 스킬로 지식 격차 해소하기 구글 딥마인드는 정적인 모델 지식과 빠르게 변화하는 소프트웨어 개발 방식 사이의 격차를 해소하기 위해, 에이전트에게 실시간 문서와 SDK 지침을 제공하는 "Gemini API 개발자 스킬"을 개발했습니다. 평가 결과, 이 스킬을 활용했을 때 gemini-3.1-pro-preview 모델의 성공률이 28.2%에서 96.6%로 대폭 향상되는 등 엄청난 성능 향상을 보였습니다. 이 가벼운 접근 방식은 모델에게 강력한 추론 능력과 "진실의 근원"에 대한 접근 권한을 부여함으로써, 구식 코딩 패턴을 효과적으로 제거할 수 있음을 보여줍니다. Closing the knowledge gap with agent skills developers.googleblog.com
플레이 건너뛰기: Gemini 및 MediaPipe로 건축하기 제공된 워크플로우는 Gemini Canvas를 사용하여 MediaPipe Pose Landmarker와 같은 메커니즘을 고수준 프롬프팅을 통해 빠르게 프로토타입을 제작함으로써 모션 제어 게임 개발을 간소화합니다. 개발자는 Google AI Studio에서 저지연 "lite" 모델과 어깨 랜드마크와 같은 안정적인 추적 포인트를 최적화하여 이러한 프로토타입을 개선하여 반응형 게임 플레이를 보장할 수 있습니다. 이 과정은 Gemini Code Assist를 사용하여 실험적인 코드를 다양한 멀티모달 입력을 지원할 수 있는 모듈식 프로덕션 준비 애플리케이션으로 리팩토링하는 것으로 마무리됩니다. Jump to play: Building with Gemini & MediaPipe developers.googleblog.com
LlamaParse와 Gemini 3.1을 사용하여 스마트 금융 어시스턴트를 구축하세요. 이 블로그 게시물은 LlamaParse와 Gemini 3.1 모델을 결합하여 복잡하고 구조화되지 않은 문서에서 고품질 데이터를 추출하는 워크플로우를 소개합니다. 밀집된 금융 테이블의 에이전트 기반 파싱을 위해 Gemini 3.1 Pro를 사용하고, 비용 효율적인 요약을 위해 Gemini 3.1 Flash를 사용하는 이벤트 기반 아키텍처를 시연합니다. 제공된 튜토리얼을 따르면 개발자는 지저분한 증권 계좌 명세서를 구조화되고 사람이 읽기 쉬운 통찰력으로 변환할 수 있는 개인 금융 비서를 구축할 수 있습니다. Build a smart financial assistant with LlamaParse and Gemini 3.1 developers.googleblog.com
AI 에이전트 프로토콜 개발자 가이드 이 블로그 게시물은 AI 에이전트가 데이터에 접근하고 통신하는 방식을 표준화하여 맞춤형 통합 코드를 제거하도록 설계된 MCP 및 A2A와 같은 6가지 프로토콜 모음을 소개합니다. "주방 관리자" 에이전트를 실용적인 예시로 사용하여, 이러한 도구들이 실시간 재고 확인, UCP를 통한 도매 상거래, AP2를 통한 안전한 결제 승인과 같은 복잡한 작업을 어떻게 처리하는지 보여줍니다. 또한, 개발자는 에이전트 개발 키트(ADK)를 활용하여 A2UI 및 AG-UI를 구현하여 사용자에게 대화형 대시보드와 원활한 스트리밍 인터페이스를 제공할 수 있습니다. Developer’s Guide to AI Agent Protocols developers.googleblog.com
Colab MCP 서버 출시: 모든 AI 에이전트를 Google Colab에 연결하세요 Gemini CLI, Claude Code 또는 자체 에이전트와 같은 AI 에이전트로 로컬에서 프로토타입을 만들 때, ... Announcing the Colab MCP Server: Connect Any AI Agent to Google Colab developers.googleblog.com