Google Developers Blog 한국어 - TheNote.app

Google Developers Blog 한국어
팔로우

Developers.googleblog.com은 Google의 개발자들을 위한 공식 블로그입니다. 여기에서, 그들은 Google의 다양한 개발자 도구 및 기능, 버그 수정, 개발 기술 향상 튜토리얼에 대한 포괄적인 정보를 제공합니다. 블로그는 또한 Google의 소프트웨어 개발 프로젝트와 관련된 사례 연구, 인터뷰 및 커뮤니티 뉴스를 게시합니다.

RSS developers.googleblog.com

Google Developers Blog developers.googleblog.com

RSS Hunter • 2024년 8월 23일

노트 스레드

TPU에서 Ray 실행하기, 파트 2: Ray AI 라이브러리

이 두 번째 부분에서는 Ray의 상위 레벨 라이브러리인 Serve, Data, Train이 Google의 TPU 슬라이스에서 AI 워크로드를 실행하는 복잡성을 어떻게 추상화하는지 살펴봅니다. Ray Serve는 간단한 토폴로지 구성을 사용하여 대규모 멀티 호스트 모델을 올바르게 갱 스케줄링하는 반면, Ray Data는 네이티브 JAX 배치로 가속기에 직접 데이터를 공급하여 데이터 로딩 병목 현상을 제거합니다. 마지막으로 JaxTrainer는 크로스 슬라이스 조정, 체크포인팅 및 내결함성을 자동으로 처리하여 TPU 전반의 분산 학습을 간소화합니다.

Run Ray on TPU, Part 2: Ray AI libraries developers.googleblog.com

RSS Hunter • 7월 24일

Agentic RL 스케일링: Tunix를 이용한 고처리량 Agentic 학습

Tunix는 Google의 새로운 JAX 기반 후처리 라이브러리로, 멀티턴, 도구 사용 LLM 추론 에이전트 훈련 시 TPU 유휴 병목 현상을 제거하도록 설계되었습니다. 이는 고도로 동시적이고 비동기적인 롤아웃과 분리된 생산자-소비자 파이프라인을 결합하여 하드웨어 처리량을 극대화하며, 에이전트가 네트워크 I/O 또는 환경 단계를 기다리는 동안에도 트레이너가 지속적으로 데이터를 공급받도록 보장합니다. 또한 Tunix는 플러그 앤 플레이 추상화와 지속적인 매크로 수준 프로파일링을 제공하여 개발자가 사용자 정의 오픈 소스 환경을 쉽게 통합하고 대규모 코드 재작성 없이 복잡한 분산 워크플로우를 최적화할 수 있도록 합니다.

Scaling Agentic RL: High-Throughput Agentic Training with Tunix developers.googleblog.com

RSS Hunter • 7월 21일

TPU에서 Ray 실행하기, 1부: 기초

Ray 2.55는 Google Cloud TPU에 대한 공식적이고 일급 지원을 도입하여, 개발자들이 친숙한 Ray 작업 및 액터 API를 사용하여 Google의 가속기에서 분산 Python 워크로드를 실행할 수 있도록 합니다. 칩 간 상호 연결(ICI)을 통해 다중 호스트 TPU "슬라이스"를 함께 유지해야 하는 엄격한 네트워킹 요구 사항을 처리하기 위해, GKE의 KubeRay Operator는 기본 하드웨어 레이아웃을 자동으로 프로비저닝하고 레이블을 지정합니다. Ray Core는 slice_placement_group() 기본 요소를 통해 이러한 레이블을 활용하여 완전한 슬라이스를 원자적으로 예약함으로써, 개발자들이 사용자 지정 배치 코드를 작성하지 않고도 ("4x4"와 같은) 하드웨어 토폴로지를 선언하는 것만으로 KubeRay, Ray Train 또는 Ray Serve를 통해 작업을 배포할 수 있도록 합니다.

Run Ray on TPU, Part 1: The foundations developers.googleblog.com

RSS Hunter • 7월 20일

모듈식 프롬프트 트랜스파일링을 이용한 확장 가능한 AI 에이전트 구축

모놀리식 시스템 프롬프트로 인해 발생하는 스케일링 병목 현상과 런타임 오류를 해결하기 위해 엔지니어링 팀은 재사용 가능한 템플릿으로 지침을 모듈화하여 프롬프트를 빌드 아티팩트로 취급해야 합니다. 이러한 모듈식 "스킬 파일"을 트랜스파일러를 통해 실행함으로써 개발자는 정적 유효성 검사를 강제하고, 빌드 시 누락된 종속성을 감지하며, 프롬프트 생성을 CI/CD 파이프라인에 직접 통합할 수 있습니다. 이 결정론적 접근 방식은 코드 드리프트를 방지하고 궁극적으로 에이전트가 표준 풀 리퀘스트를 통해 자체 로직에 대한 업데이트를 제안할 수 있는 안전한 프레임워크를 구축합니다.

Building scalable AI agents with modular prompt transpilation developers.googleblog.com

RSS Hunter • 7월 16일

진화하는 Spec-Driven Development: Conductor, 이제 Antigravity 지원

Conductor는 Gemini CLI 확장 프로그램에서 휴대용 플러그인으로 발전하여 Antigravity CLI 및 Claude와 같은 생태계에 대화형 Spec-Driven Development(SDD)를 제공합니다. 개발자는 엄격한 명령 시퀀스에 의존하는 대신, AI 어시스턴트와 자연스럽게 대화하면서 백그라운드에서 spec.md 및 plan.md와 같은 지속적인 마크다운 아티팩트를 동적으로 관리할 수 있습니다. 이 업데이트는 워크플로우 마찰을 제거하는 동시에 리포지토리가 다양한 AI 도구에 걸쳐 프로젝트의 아키텍처 및 상태에 대한 버전 관리되는 단일 진실 공급원으로 유지되도록 보장합니다.

Evolving Spec-Driven Development: Conductor Now Supports Antigravity developers.googleblog.com

RSS Hunter • 7월 16일

Gemini Enterprise Agent Platform의 선택지 확장: 병렬 웹 검색을 통한 Grounding 도입

Google Cloud는 Gemini Enterprise Agent Platform에서 Parallel의 검색 인프라를 웹 그라운딩 제공업체로 네이티브 통합하기 위해 Parallel Web Systems와 파트너십을 맺었습니다. 이 통합을 통해 개발자는 검증 가능하고 실시간 웹 결과에 AI 에이전트를 고정하여 복잡한 엔터프라이즈 워크플로우의 사실적 정확성을 크게 향상시킬 수 있습니다. 또한, 이 파트너십은 확장된 아키텍처 유

Expanding Choice in Gemini Enterprise Agent Platform: Introducing Grounding with Parallel Web Search developers.googleblog.com

RSS Hunter • 7월 16일

시스템 엔지니어링 플레이북: Ironwood (TPU7x)에서 Qwen 3.5-397B MoE 최적화

397B-매개변수 Qwen 3.5 Mixture-of-Experts (MoE) 모델을 Ironwood TPU에서 서비스하기 위해 엔지니어들은 모듈식 JAX/Pallas 최적화 스택을 개발하여 사전 채우기(prefill)가 많은 워크로드에서 최대 4.7배의 추론 속도 향상을 달성했습니다. 팀은 하이브리드 데이터 병렬화 및 전문가 병렬화(DP+EP) 토폴로지를 배포하여 심각한 하드웨어 샤딩 제약을 우회했으며, 계층적 reduce-scatter와 같은 사용자 정의 저수준 통신 융합을 페어링하여 디바이스 간 토큰 라우팅을 최적화했습니다. 마지막으로, Batched Ragged Page Attention 및 완전 융합된 Gated DeltaNet (GDN) 블록과 같은 하드웨어 인식 사용자 정의 커널을 실행하여 HBM 대역폭과 TensorCore MXU를 포화시켜 시스템 처리량을 이론적 루프라인 한계에 가깝게 끌어올렸습니다.

Systems Engineering Playbook: Optimizing Qwen 3.5-397B MoE on Ironwood (TPU7x) developers.googleblog.com

RSS Hunter • 7월 14일

Google Tensor와 Pixel로 온디바이스 AI의 다음 시대를 열다

Google I/O Connect India에서 Google은 새로운 Pixel 10 제품군을 위한 맞춤형 Tensor SoC 및 TPU로 구동되는 100% 개인 정보 보호, 온디바이스 AI의 미래를 선보였습니다. 이 행사에서는 경량 Gemma 4 E2B 모델이 처음 공개되었으며, 이 모델은 기기에서 네이티브로 실행되어 AI 채팅, 실시간 이미지 인식, 개인 에이전트 작업과 같은 완전한 오프라인 멀티모달 기능을 지원합니다. 개발자는 오늘 새로 발표된 Tensor SDK 베타 및 이에 수반되는 오픈 소스 리소스를 통해 이러한 안전한 엣지 기반 애플리케이션 구축을 시작할 수 있습니다.

Unlocking the Next Era of On-Device AI with Google Tensor and Pixel developers.googleblog.com

RSS Hunter • 7월 14일

LiteRT.js, Google의 고성능 웹 AI 추론

LiteRT 제품군의 최신 멤버인 LiteRT.js를 소개하게 되어 기쁩니다! LiteRT.js는 머신러닝 모델을 브라우저에서 직접 실행할 수 있는 강력한 솔루션으로, Google의 크로스 플랫폼 엣지 AI 런타임을 웹으로 확장합니다. JavaScript 개발자를 위해 구축된 LiteRT.js는 WebGPU 및 향후 WebNN에서 최첨단 ML 모델 추론 성능을 제공하며, CPU의 경우 WebAssembly로 대체됩니다. 이 게시물에서는 LiteRT.js를 간략하게 살펴보고 웹 개발자가 시작하는 데 필요한 모든 것을 제공합니다.

LiteRT.js, Google's high performance Web AI Inference developers.googleblog.com

RSS Hunter • 7월 9일

도메인 격차 해소: Antigravity와 Gemini로 구축된 AI 레이스 코치

2026년 5월 23일, Google I/O 무대에서 막 내려온 저희 Google Developer Experts(GDE)들이...

Bridging the Domain Gap: AI Race Coach built with Antigravity and Gemini developers.googleblog.com

RSS Hunter • 7월 8일

TPU를 훈련 중에 중단하고 몇 초 만에 복구했습니다: MaxText를 사용한 탄력적 훈련 소개

분산 AI 학습은 단일 머신의 손실이 일반적으로 전체 멀티노드 작업을 중단시켜 시간 소모적인 전체 워크로드 인프라 재시작을 강요하기 때문에 악명 높게 불안정합니다. 이를 해결하기 위해 Google의 JAX 생태계는 Pathways를 통한 탄력적 학습을 활용하며, 이는 하드웨어 오류를 잡을 수 있는 Python 예외로 변환하여 실행 중인 프로세스가 생존할 수 있도록 합니다. 계획되지 않은 오류가 발생하면 시스템은 손상된 워커만 자동으로 교체하고, Cloud Storage에서 마지막으로 유효한 체크포인트를 복원하며, 제자리에서 학습을 재개하여 총 다운타임을 2분 미만으로 최소화하고 메인 컨트롤러 프로세스를 전혀 재시작하지 않습니다.

We terminated a TPU mid-training and it recovered in seconds: Introduction to elastic training with MaxText developers.googleblog.com

RSS Hunter • 7월 6일

Genkit으로 에이전트 기반 풀스택 앱을 구축하세요

오픈 소스 Genkit 프레임워크가 대화형 AI의 복잡한 배관 작업을 메시지 기록, 도구 루프 및 스트리밍을 단일 인터페이스로 패키징하여 단순화하도록 설계된 풀스택 도구인 Agents API를 도입했습니다. 이 API는 유연한 서버 또는 클라이언트 관리 상태 지속성을 지원하여 기록 분기, 장기 실행 분리 작업 및 다중 에이전트 조정과 같은 고급 워크플로우를 허용하는 동시에 통합 와이어 프로토콜을 통해 백엔드를 프런트엔드에 원활하게 연결합니다. 현재 TypeScript 및 Go에 대한 미리 보기로 제공되며 Genkit 개발자 UI와 통합되어 개발자가 클라이언트 코드를 작성하지 않고도 에이전트 스냅샷을 쉽게 테스트, 디버그 및 검사할 수 있습니다.

Build agentic full-stack apps with Genkit developers.googleblog.com

RSS Hunter • 7월 1일

Google Cloud 파워를 활용한 VS Code에서의 ML 개발: Workbench 확장 프로그램 출시

VS Code용 Google Cloud Workbench Notebooks 확장 프로그램이 공식 출시되어 개발자들이 로컬 IDE를 확장 가능하고 클라우드 기반의 Jupyter 환경에 연결할 수 있게 되었습니다. 이 통합은 컨텍스트 전환을 제거하고 고성능 Google Cloud 인프라에 직접 액세스할 수 있도록 하여 머신러닝 라이프사이클을 간소화합니다. 투명성과 커뮤니티 주도 혁신을 지원하기 위해 새로 출시된 확장 프로그램은 완전히 오픈 소스로 GitHub 및 VS Code Marketplace에서 사용할 수 있습니다.

ML Development in VS Code with Google Cloud Power: Workbench Extension Now Available developers.googleblog.com

RSS Hunter • 7월 1일

ADK 2.0을 개발한 이유

ADK 2.0을 구축한 이유에 대한 질문에 답합니다. 이는 ADK 2.0 출시 다음 날 게시될 예정이며, 개발 이유, 일부 기능 및 개발자가 업그레이드를 고려해야 하는 이유를 설명합니다.

Why we built ADK 2.0 developers.googleblog.com

RSS Hunter • 7월 1일

ADK Go 2.0으로 안정적인 멀티 에이전트 애플리케이션을 구축하세요. 새로운 그래프 기반 워크플로우 엔진, 내장된 휴먼 인 더 루프, 동적 오케스트레이션을 살펴보세요.

Go 2.0용 Agent Development Kit(ADK)가 출시되어, 개발자들이 복잡한 멀티 에이전트 애플리케이션을 구성할 수 있도록 돕는 최초의 그래프 기반 워크플로우 엔진을 선보입니다. 이번 업데이트는 human-in-the-loop(HITL) 오케스트레이션, 일반 Go 코드를 사용한 동적 실행, 그리고 지수 백오프 재시도와 같은 자동 복원력 기능을 위한 내장 프리미티브를 추가했습니다. 실행 모델을 통합함으로써, 단일 에이전트 애플리케이션과 복잡한 그래프 모두 동일한 런타임에서 실행되어 텔레메트리 및 상태 지속성을 단순화합니다.

Build reliable multi-agent applications with ADK Go 2.0. Discover our new graph-based workflow engine, built-in human-in-the-loop, and dynamic orchestration developers.googleblog.com

RSS Hunter • 6월 30일

코딩 에이전트로부터 에이전트 품질 플라이휠 추진하기

AI 에이전트 구축은 종종 개발자들에게 프롬프트 수정이 프로덕션에서 광범위한 회귀를 우연히 유발할지에 대한 불확실성을 남깁니다. 이 격차를 해소하기 위해 Google은 코딩 에이전트를 위한 새로운 개발자 스킬을 도입했습니다. 이 스킬은 5단계 평가 플라이휠을 자동화합니다: 데이터 준비, 추론 실행, 적응형 AutoRaters를 사용한 채점, 실패 클러스터 분석, 그리고 목표 최적화 실행. 프로덕션 트래픽에 대해 지속적으로 실행되거나 합성 시나리오를 통해 온디맨드로 실행되는 이 도구를 통해 개발자는 일반 언어로 테스트 목표를 설명할 수 있으며, 독립적인 평가 서비스는 실제 성능 개선을 안전하게 검증하고 집계합니다.

Driving the Agent Quality Flywheel from Your Coding Agent developers.googleblog.com

RSS Hunter • 6월 30일

Google의 Agent Development Kit 및 A2A를 사용하여 언어 간 다중 에이전트 팀 구축

Python 에이전트와 Go 에이전트가 Agent2Agent 프로토콜을 사용하여 계약 준수를 협업하는 방법Y...

Build Cross-Language Multi-Agent Team with Google’s Agent Development Kit and A2A developers.googleblog.com

RSS Hunter • 6월 22일

줄스와 함께 중요한 것을 측정하다

AI 코딩 에이전트는 프롬프트 시 작업을 완료하는 수동적인 조수에서 빠르게 변화하고 있습니다...

Measuring What Matters with Jules developers.googleblog.com

RSS Hunter • 6월 22일

A2A가 협업 에이전트의 세계를 구축하는 방법

Agent-to-Agent(A2A) 프로토콜 출시 1주년을 기념하며, 이 블로그 게시물은 이 프레임워크가 어떻게 전통적인 API의 경직성 없이 자율 AI 에이전트가 안전하게 협업하고 작업을 인계할 수 있도록 하는지 강조합니다. 복잡한 워크플로우를 전문화된 피어 에이전트에게 위임함으로써, A2A는 컨텍스트 오염을 방지하고, 데이터 프라이버시를 보장하며, 모듈성을 통해 애플리케이션 설계를 단순화합니다. 이 생태계를 실제 작동하는 모습으로 보여주기 위해, 게시물은 생명 과학 분야의 에이전트 인터페이스인 FoldRun을 조명합니다. FoldRun은 복잡한 단백질 구조 예측을 조율하며, 상거래, 데이터 스트리밍, DevOps, 통신 전반에 걸친 다양한 A2A 사용 사례를 선보입니다.

How A2A is Building a World of Collaborative Agents developers.googleblog.com

RSS Hunter • 6월 18일

A2UI + MCP 앱: 선언형 및 맞춤형 에이전트 UI의 장점을 결합

이 게시물은 Model Context Protocol (MCP) 앱과 Agent-to-User Interface (A2UI)를 통합하기 위해 설계된 세 가지 아키텍처 패턴을 소개하며, 이는 고도로 맞춤화된 iframe 환경과 네이티브, 선언적 렌더링 간의 절충점을 해결합니다. 이러한 접근 방식을 결합함으로써 개발자는 MCP 서버를 통해 직접 네이티브와 같은 느낌의 UI를 제공하거나, 선언적 뷰 내에 복잡하고 상태적인 iframe 앱을 안전하게 포함시키거나, 레거시 시스템에 생성적 UI 구성 요소를 주입할 수 있습니다. 궁극적으로 이러한 하이브리드 프레임워크는 엔지니어링 팀이 특정 프로젝트 제약 조건에 맞춰 안전하고 성능이 뛰어나며 브랜드 일관성을 유지하는 에이전트형 사용자 경험을 제공할 수 있도록 지원합니다.

A2UI + MCP Apps: Combining the best of declarative and custom agentic UIs developers.googleblog.com

RSS Hunter • 6월 17일

Agentic Resource Discovery 사양 발표

웹 전반에 걸쳐 도구, 기술 및 에이전트를 찾고 검증하기 위한 개방형 사양입니다. 에이전트는...

Announcing the Agentic Resource Discovery specification developers.googleblog.com

RSS Hunter • 6월 17일

TPU 스택의 힘을 열다: 새로운 개발자 허브 소개

Google이 모델 빌더와 개발자가 Google Cloud TPU의 성능을 극대화하도록 돕기 위해 설계된 중앙 집중식 교육 리소스인 TPU 개발자 허브를 공식 출시했습니다. 이 허브는 코드 우선 리소스, 오픈 소스 레시피, 하드웨어 아키텍처, 소프트웨어 최적화, 디버깅, 병렬 처리 및 네트워킹을 다루는 심층 문서 등을 제공합니다. 이러한 자료는 대규모 학습부터 저지연 추론 워크로드까지 모든 것을 간소화하기 위해 인간 개발자와 AI 지원 도구 모두에게 맞춰져 있습니다.

Unlocking the Power of the TPU Stack: Introducing our new Developer Hub developers.googleblog.com

RSS Hunter • 6월 16일

보안 및 신뢰 강화: Google 로그인에 새로운 세션 메타데이터 도입

Google은 개발자에게 더 깊은 세션 메타데이터를 제공하기 위해 새로운 OIDC 표준 클레임, 특히 auth_time 및 amr(Authentication Methods Reference)을 도입하여 Sign in with Google을 강화하고 있습니다. 이러한 업데이트를 통해 검증된 앱은 사용자의 로그인 "신선도"와 사용된 특정 인증 방법(예: MFA 또는 하드웨어 키)을 확인할 수 있어, 보다 동적이고 위험 기반의 액세스 제어가 가능해집니다. 이러한 연합 ID 신호를 활용함으로써 플랫폼은 계정 탈취 및 사기를 더 잘 방지하는 동시에 민감한 작업에 대한 단계별 인증과 같은 세분화된 보안 정책을 구현할 수 있습니다.

Enhance Security and Trust: New Session Metadata in Sign in with Google developers.googleblog.com

RSS Hunter • 6월 16일

DiffusionGemma: 개발자 가이드

DiffusionGemma는 Gemma 4 아키텍처를 기반으로 구축된 실험적인 텍스트 생성 모델로, 토큰별 자기회귀 대신 확산 기반 병렬 생성을 사용하여 추론 속도를 훨씬 빠르게 하고, 양방향 컨텍스트 인식을 가능하게 하며, 실시간 자체 수정을 지원하면서도 소비자용 GPU에 배포할 수 있습니다. 이 아키텍처는 반복적인 노이즈 제거를 통해 256개 토큰 블록을 병렬로 생성하고 개선하여, 스도쿠와 같은 복잡한 제약 기반 작업을 기존 언어 모델보다 더 효과적으로 처리할 수 있게 하고 미세 조정을 통한 강력한 성능 향상을 보여줍니다. 이 모델은 vLLM 및 기타 인기 있는 추론 프레임워크와 통합되어 개발자들에게 고성능, 효율적인 긴 컨텍스트 확장, 그리고 간단한 사용자 정의 및 배포를 결합한 새로운 비자기회귀 접근 방식을 제공합니다.

DiffusionGemma: The Developer Guide developers.googleblog.com

RSS Hunter • 6월 10일

Google Colab CLI 소개

Google은 개발자와 AI 에이전트가 로컬 터미널을 원격 Colab 런타임에 연결하여 원활하게 실행할 수 있도록 하는 새로운 도구인 Google Colab Command-Line Interface(CLI)를 발표했습니다. 이 경량 CLI를 통해 사용자는 고성능 GPU를 쉽게 요청하고, 로컬 Python 스크립트를 원격으로 실행하며, fine-tuned Gemma 3 어댑터와 같은 아티팩트 로그 또는 모델을 원활하게 검색할 수 있습니다. 표준 터미널 환경에 직접 통합함으로써 이 도구는 프로그래밍 가능성이 높으며 Antigravity 또는 Claude Code와 같은 AI 에이전트가 복잡한 머신러닝 파이프라인을 관리하는 데 사용할 준비가 되어 있습니다.

Introducing the Google Colab CLI developers.googleblog.com

RSS Hunter • 6월 5일

Gemma 4 12B: 개발자 가이드

새롭게 출시된 Gemma 4 12B는 소비자 기기에서 고성능 로컬 AI 실행을 위해 설계된 밀집형 멀티모달 모델입니다. 새로운 인코더 없는 아키텍처를 도입하여, 전통적인 시각 및 오디오 인코더를 우회하고 멀티모달 데이터를 LLM 백본에 직접 공급합니다.

Gemma 4 12B: The Developer Guide developers.googleblog.com

RSS Hunter • 6월 3일

Google AI Edge를 사용하여 노트북에서 Gemma 4 12B를 실행하고 로컬 에이전트 워크플로우를 활용하는 방법

Google DeepMind의 Gemma 4 12B 모델은 16GB RAM을 갖춘 일반 노트북에 에이전트 기반의 멀티모달 AI 기능을 제공하여 로컬 데이터 처리 및 시각적 인사이트 생성을 가능하게 합니다. 사용자는 Google AI Edge Gallery를 통해 macOS에서 이 모델을 활용하여 동적인 Python 코드 실행 및 시각화를 할 수 있으며, Google AI Edge Eloquent를 통해 완전히 오프라인 상태에서 음성 받아쓰기 및 텍스트 편집도 가능합니다. 또한, LiteRT-LM CLI의 새로운 serve 명령어를 통해 개발자 워크플로우가 향상되어, 완전 로컬 AI 도구 및 에이전트를 구동하기 위한 업계 호환 로컬 엔드포인트를 생성할 수 있습니다.

Bringing Gemma 4 12B to your Laptop: Unlocking Local, Agentic Workflows with Google AI Edge developers.googleblog.com

RSS Hunter • 6월 3일

"커뮤니티가 Tunix와 TPU를 사용하여 Gemma를 "생각"하도록 훈련시킨 방법"

Kaggle에서 열린 Google Tunix Hackathon은 개발자들에게 작고 추론 능력이 없는 기본 모델을 Kaggle TPU와 제한된 컴퓨팅 예산을 사용하여 일반 추론 엔진으로 변환하도록 도전했습니다. 우승팀은 지도 미세 조정(SFT)과 GRPO 및 SimPO와 같은 고급 정렬 기법을 결합한 다단계 사후 훈련 파이프라인을 구현하여 이를 달성했습니다. 궁극적으로 이 대회는 커뮤니티가 접근 가능하고 오픈 소스 리소스를 사용하여 매우 유능하고 구조화된 추론 모델을 성공적으로 훈련할 수 있음을 증명함으로써 AI 개발을 민주화했습니다.

How the community trained Gemma to "Think" with Tunix and TPUs developers.googleblog.com

RSS Hunter • 5월 28일

Google Pay & Wallet 개발자 MCP 서버로 통합 워크플로우를 강화하세요

Google은 AI 개발 보조 도구와 IDE를 실시간 API 및 계정 컨텍스트와 안전하게 연결하도록 설계된 개방형 표준 도구인 새로운 Google Pay & Wallet 개발자 MCP 서버를 발표했습니다. 이 서버를 통해 개발자는 개발 환경 내에서 공식 문서를 검색하고, Wallet 패스 정의를 검증하고, 통합 상태를 확인하고, 판매자 계정을 관리할 수 있습니다. 궁극적으로 이 통합은 컨텍스트 전환을 최소화하고 최신 정보를 기반으로 한 AI 지원을 제공함으로써 마찰을 줄이고 개발 워크플로우를 가속화하는 것을 목표로 합니다.

Supercharge your integration workflow with the Google Pay & Wallet Developer MCP server developers.googleblog.com

RSS Hunter • 5월 28일

Google Pay의 최신 업데이트

Google Pay는 Universal Commerce Protocol과 AI 에이전트가 통합을 관리하고 트렌드를 분석할 수 있도록 하는 새로운 MCP 서버를 도입하여 "에이전트 기반 커머스"를 위해 진화하고 있습니다. 새로운 Android 업데이트는 원활한 익스프레스 체크아웃을 위한 동적 콜백을 도입하고 WebView를 통해 소셜 미디어 앱으로 결제 지원을 확장합니다. 또한, 플랫폼은 교차 기기 생체 인증과 새로운 거래 신호를 출시하여 판매자가 마찰을 줄이고 처리 비용을 최적화하도록 지원합니다.

The latest updates to Google Pay developers.googleblog.com

RSS Hunter • 5월 27일

Google Pay에서 동적 콜백을 이용한 Android 결제 기능 강화

저희는 개발자를 위해 Android 네이티브 앱에서 Google Pay를 통한 Express checkout을 선보이게 되어 기쁩니다...

Enhancing Android Checkout with Dynamic Callbacks in Google Pay developers.googleblog.com

RSS Hunter • 5월 26일

Gemini for Home로 서비스 제공업체 및 하드웨어 파트너 역량 강화

Google은 고급 카메라 인텔리전스, 자연어 쿼리 및 일일 활동 요약을 통합하는 풀스택 Gemini AI 오퍼링을 출시하여 스마트 홈 생태계를 확장하고 있습니다. 이 이니셔티브는 서비스 제공업체와 하드웨어 제조업체에게 광범위한 연구 개발 없이도 선제적이고 브랜드화된 서비스를 구축할 수 있는 턴키 레퍼런스 디자인과 API를 제공합니다. 궁극적으로 이 프로그램은 기본적인 장치 제어를 넘어 맥락을 이해하고 실시간으로 사용자의 요구를 돌볼 수 있는 AI 네이티브 홈으로 나아가는 것을 목표로 합니다.

Empowering Service Providers and Hardware Partners with Gemini for Home developers.googleblog.com

RSS Hunter • 5월 21일

Kotlin용 ADK 및 Android용 ADK 0.1.0 발표: Android 및 그 이상에서 AI 에이전트 구축

ADK for Kotlin은 백엔드 프로젝트에 에이전트 워크플로우를 제공하며, ADK for Android는 spe...

Announcing ADK for Kotlin and ADK for Android 0.1.0: Building AI Agents on Android and Beyond developers.googleblog.com

RSS Hunter • 5월 21일

Google I/O 2026 개발자 키노트의 모든 뉴스

Google은 Gemini 3.5 시리즈 출시와 Antigravity 에이전트 우선 개발 플랫폼의 주요 업데이트를 강조하며, 보조 AI에서 독립 에이전트로의 전환을 발표했습니다. 모바일 개발자를 위해, 이 게시물은 새로운 Android CLI 도구, Android Bench 평가 리더보드, 그리고 다양한 프레임워크를 네이티브 Kotlin 코드로 신속하게 변환하도록 설계된 자동화된 Migration 에이전트를 소개합니다. 웹 개발 또한 에이전트용 Chrome DevTools, HTML-in-Canvas API, 그리고 브라우저 기반 AI 에이전트가 복잡한 작업을 실행할 수 있도록 하는 개방형 웹 표준인 WebMCP 제안을 통해 변화하고 있습니다.

All the news from the Google I/O 2026 Developer keynote developers.googleblog.com

RSS Hunter • 5월 20일

혁신의 1년: Google Cloud x NVIDIA 개발자 커뮤니티 10만 회원 달성 기념

Google Cloud와 NVIDIA 개발자 커뮤니티가 10만 명의 회원과 함께 첫 번째 생일을 기념하며, 빌더들에게 고급 AI 인프라 및 리소스를 제공하는 데 중점을 두고 있습니다. 개발을 가속화하기 위해 커뮤니티는 LLM 최적화, GPU 가속 데이터 분석을 마스터하기 위한 큐레이션된 학습 경로와 월별 전문가 주도 웨비나를 제공합니다. 두 번째 해를 맞이하여 이 이니셔티브는 실습 실험실, 엔지니어링 이벤트 및 에이전트 AI 성장에 초점을 맞춘 전문 콘텐츠를 포함하도록 확장될 것입니다.

One Year of Innovation: Celebrating 100k Members in the Google Cloud x NVIDIA Developer Community developers.googleblog.com

RSS Hunter • 5월 20일

중요 업데이트: Gemini CLI를 Antigravity CLI로 전환

Google은 커뮤니티 중심의 Gemini CLI를 복잡하고 다중 에이전트 워크플로우를 위해 구축된 새로운 에이전트 우선 플랫폼인 Antigravity CLI로 전환하여 AI 터미널 도구를 통합하고 있습니다. 이 새로운 Go 기반 도구는 더 빠른 실행, 비동기 처리, 그리고 Antigravity 2.0 데스크톱 애플리케이션과 동기화되는 통합 아키텍처를 제공합니다. 기업 고객은 기존 액세스를 유지하지만, 개인 및 무료 사용자는 Gemini CLI가 2026년 6월 18일에 요청 처리를 중단하기 전에 새로운 플랫폼으로 전환해야 합니다.

An important update: Transitioning Gemini CLI to Antigravity CLI developers.googleblog.com

RSS Hunter • 5월 19일

더 스마트한 Google AI 엣지 갤러리: MCP 통합, 알림 및 세션 연속성

Google AI Edge Gallery 앱은 Android에서 오픈 소스 Model Context Protocol(MCP)에 대한 실험적 지원을 도입하여 온디바이스 AI 기능을 확장했으며, 이를 통해 Gemma 4는 Google Workspace 및 Google Maps와 같은 외부 데이터 소스 전반에 걸쳐 복잡한 작업을 조정할 수 있습니다. 보다 능동적이고 지속적인 사용자 상호 작용을 가능하게 하기 위해 업데이트에는 루틴 자동화를 위한 "Schedule Notification" 스킬과 거의 즉시 긴 세션 컨텍스트를 복원하는 지속적인 채팅 기록 기능이 추가되었습니다. 오픈 소스 툴킷에 의해 구동되는 이 플랫폼은 커뮤니티 개발자가 GitHub 리포지토리를 통해 맞춤형 유틸리티 중심 워크플로, 프롬프트 구성 및 도구 통합을 구축하고 공유하도록 장려합니다.

A Smarter Google AI Edge Gallery: MCP integration, notifications, and session continuity developers.googleblog.com

RSS Hunter • 5월 19일

Google Tensor SDK Beta with LiteRT

Google Tensor ML SDK가 베타 단계로 전환되어, 개발자들은 Google Pixel 10 기기의 TPU에 직접 고성능 머신러닝 모델을 구축하고 배포할 수 있게 되었습니다. Google의 엣지 배포 프레임워크인 LiteRT와 통합함으로써, SDK는 개발자들이 PyTorch 또는 TFLite 모델을 변환, 컴파일 및 실행할 수 있는 통합 워크플로우를 제공하며 강력한 폴백 옵션을 지원합니다. 또한, 새로운 모델 가든은 Gemma 3를 포함한 100개 이상의 클래식 및 생성형 AI 모델을 제공하여 음성 인식, 컴퓨터 비전, 텍스트 생성과 같은 저지연, 개인 정보 보호 기능을 가능하게 합니다.

Google Tensor SDK Beta with LiteRT developers.googleblog.com

RSS Hunter • 5월 19일

LiteRT-LM으로 초고속 온디바이스 GenAI

Google AI Edge의 LiteRT-LM은 Gemma 4를 크로스 플랫폼 모바일 및 엣지 환경에서 실행하기 위한 프로덕션 검증된 고도로 최적화된 인프라를 제공합니다. 메모리 효율적인 동적 로딩, 최대 2.2배의 속도 향상을 위한 Multi-Token Prediction, 그리고 Thinking Mode 및 Constrained Decoding과 같은 고급 오케스트레이션 도구를 활용하여 온디바이스에서 모델의 네이티브 멀티모달 및 에이전트 기능을 적극적으로 활성화합니다. 또한, 이 엔진은 Android를 넘어 통합 표면을 빠르게 확장하고 있으며, Apple 생태계를 위한 새로운 네이티브 Swift API와 고성능 서버리스 브라우저 추론을 위한 WebGPU 가속 JavaScript API를 도입하고 있습니다.

Blazing fast on-device GenAI with LiteRT-LM developers.googleblog.com

RSS Hunter • 5월 19일

Genkit 미들웨어 발표: 에이전트 앱 가로채기, 확장 및 강화

Genkit는 개발자가 TypeScript, Go, Dart 및 Python을 사용하여 프로덕션 준비가 된 에이전트 AI 애플리케이션을 구축하도록 돕기 위해 설계된 오픈 소스 프레임워크입니다. 이 프레임워크는 재시도, 모델 대체, 인간 루프 도구 승인과 같은 사용자 정의 동작을 주입하기 위해 생성 호출을 가로채는 강력한 미들웨어 시스템을 활용합니다. 생성, 모델 및 도구 계층에 후크를 연결함으로써 개발자는 모델 출력에 대한 높은 안정성과 결정론적 제어를 보장할 수 있습니다. 또한 Genkit는 사용자 정의 미들웨어를 생성하고 스택할 수 있으며, 이 모든 것은 전용 개발자 UI를 통해 검사하고 디버깅할 수 있습니다.

Announcing Genkit Middleware: Intercept, extend, and harden your agentic apps developers.googleblog.com

RSS Hunter • 5월 14일

온디바이스 AI 가속화: Arm과 Google의 AI 엣지 최적화 살펴보기

Arm Scalable Matrix Extension 2 (SME2)와 Google AI Edge 소프트웨어 스택의 통합은 CPU를 강력한 행렬 연산 가속기로 전환하여 고성능의 온디바이스 생성형 AI를 가능하게 합니다. Stability AI의 "stable-audio-open-small" 모델을 사례 연구로 사용하여, LiteRT, XNNPACK, KleidiAI를 활용하여 하드웨어 가속을 자동화하는 간소화된 "변환, 최적화 및 배포" 파이프라인을 개략적으로 설명합니다. 결과적인 구현은 오디오 생성 속도를 2배 이상 향상시키고 메모리 사용량을 4배 줄이는 동시에 Arm 기반 모바일 장치 및 노트북에서 높은 오디오 품질을 유지합니다.

Accelerating on-device AI: A look at Arm and Google AI Edge optimization developers.googleblog.com

RSS Hunter • 5월 14일

ADK로 일시 중지, 재개 가능하며 컨텍스트를 잃지 않는 장기 실행 AI 에이전트를 구축하세요.

"HR 온보딩과 같이 며칠 또는 몇 주에 걸쳐 진행되는 장기 엔터프라이즈 워크플로우를 관리할 수 있는 스테이트리스 챗봇에서 프로덕션 등급 에이전트로 전환하는 방법. 에이전트 개발 키트(ADK)와 그 아키텍처 변경 사항을 소개하며, 특히 내구성이 뛰어난 상태 기계와 영구 세션 스토리지를 사용하여 에이전트가 "유휴 시간" 또는 서버 재시작 중에 컨텍스트를 절대 잃지 않도록 합니다. 이벤트 기반 웹훅과 다중 에이전트 위임을 활용하여, 일시 중지 중에 "잠들었다가" 복잡한 작업을 높은 추론 정확도로 재개하기 위해 깨어나는 복원력 있는 시스템을 구축하는 방법을 보여줍니다."

Build Long-running AI agents that pause, resume, and never lose context with ADK developers.googleblog.com

RSS Hunter • 5월 12일

Google TPU에서 LLM 추론 성능 극대화: 확산 스타일 추측 디코딩으로 3배 속도 향상 달성

UCSD의 연구원들은 Google TPU에 블록 확산 추측 디코딩 방법인 DFlash를 성공적으로 구현하여 기존의 자기회귀 초안 작성의 순차적 병목 현상을 우회했습니다. 한 번의 순방향 패스로 후보 토큰의 전체 블록을 하나씩 예측하는 대신 "페인팅"함으로써, 시스템은 평균 3.13배의 속도 향상을 달성했으며, 최고 성능은 EAGLE-3과 같은 기존 방법의 거의 두 배에 달했습니다. vLLM 생태계에 대한 이 오픈 소스 통합은 "무료" 병렬 검증과 복잡한 추론 작업을 위한 고품질 초안 예측을 활용하여 TPU 하드웨어를 최적화합니다.

Supercharging LLM inference on Google TPUs: Achieving 3X speedups with diffusion-style speculative decoding developers.googleblog.com

RSS Hunter • 5월 4일

Gemini Embedding 2로 구축하기: 에이전트 기반 멀티모달 RAG 및 그 이상

Google이 텍스트, 이미지, 비디오, 오디오 및 문서를 단일 의미 공간으로 매핑하는 통합 모델인 Gemini Embedding 2의 일반 출시를 발표했습니다. 이 모델을 통해 개발자는 단일 요청으로 인터리브된 멀티모달 입력을 처리할 수 있어 에이전트 RAG, 시각적 검색 및 콘텐츠 조정과 같은 작업의 성능을 크게 향상시킬 수 있습니다. 100개 이상의 언어를 지원하고 작업별 접두사 및 Matryoshka 차원 축소와 같은 기능을 제공함으로써 이 모델은 복잡한 AI 에이전트를 구축하기 위한 매우 효율적이고 정확한 기반을 제공합니다.

Building with Gemini Embedding 2: Agentic multimodal RAG and beyond developers.googleblog.com

RSS Hunter • 4월 30일

AI 속도 향상: GCSFS와 Rapid Bucket을 통해 Google Colossus를 PyTorch에 도입

구글 클라우드는 AI 훈련 병목 현상을 제거하기 위해 Rapid Storage를 fsspec 인터페이스를 통해 PyTorch에 직접 연결하는 고성능 통합 기능을 도입했습니다. 구글의 Colossus 아키텍처와 양방향 gRPC 스트리밍을 활용하여 이 솔루션은 최대 15 TiB/s의 집계 처리량과 상당한 지연 시간 감소를 제공합니다. 이러한 개선 사항을 통해 개발자는 스토리지 버킷 유형을 업데이트하는 것 외에 코드 변경 없이 총 훈련 시간을 23%까지 단축할 수 있습니다.

Speeding Up AI: Bringing Google Colossus to PyTorch via GCSFS and Rapid Bucket developers.googleblog.com

RSS Hunter • 4월 29일

LiteRT와 NPU를 이용한 실제 기기 내 AI 구축

LiteRT는 모바일 개발자가 신경망 처리 장치(NPU)의 성능을 최대한 활용할 수 있도록 설계된 실용적인 프레임워크입니다. 이는 기존 CPU 또는 GPU 처리 방식의 성능 및 배터리 제약 사항을 극복하는 데 도움을 줍니다. 하드웨어 복잡성을 추상화하는 통합 API를 제공함으로써, Google Meet 및 Epic Games와 같은 업계 선두 기업들이 실시간 비디오, 애니메이션, 음성 인식과 같은 정교한 AI 모델을 훨씬 더 효율적으로 배포할 수 있도록 지원합니다. 또한, 이 플랫폼은 벤치마킹 도구 및 크로스 플랫폼 호환성을 통해 개발자를 지원하여 모바일 기기, AI PC, 산업용 IoT 하드웨어 전반에 걸쳐 원활한 AI 배포를 가능하게 합니다.

Building real-world on-device AI with LiteRT and NPU developers.googleblog.com

RSS Hunter • 4월 24일

Agent Platform의 Agents CLI: 하나의 CLI로 개발부터 프로덕션까지

Google Cloud가 로컬 개발과 프로덕션 수준의 AI 에이전트 배포 간의 격차를 해소하기 위해 설계된 전문 도구인 Agents CLI를 출시했습니다. 이 CLI는 코딩 도우미에게 전체 Google Cloud 스택에 대한 기계 판독 가능한 액세스를 제공하여 스캐폴딩 과정에서 컨텍스트 과부하와 토큰 낭비를 줄입니다. 평가, 인프라 프로비저닝 및 배포를 단일 프로그래밍 백본으로 간소화함으로써 이 도구를 통해 개발자는 초기 개념에서 라이브 서비스까지 몇 주가 아닌 몇 시간 만에 전환할 수 있습니다.

Agents CLI in Agent Platform: create to production in one CLI developers.googleblog.com

RSS Hunter • 4월 22일

프로덕션 레디 AI 에이전트: 모놀리스 리팩토링에서 얻은 5가지 교훈

이 블로그 게시물은 불안정한 판매 연구 프로토타입을 Google의 에이전트 개발 키트(ADK)를 사용하여 강력한 프로덕션 에이전트로 전환하는 과정을 설명합니다. 개발자들은 모놀리식 스크립트를 오케스트레이션된 하위 에이전트와 구조화된 Pydantic 출력으로 대체함으로써, 조용한 실패와 취약한 파싱을 제거했습니다. 또한, 이 게시물은 AI 에이전트가 실제 애플리케이션에서 확장 가능하고, 비용 효율적이며, 투명성을 확보하기 위해 동적 RAG 파이프라인과 OpenTelemetry 관측 가능성이 필수적임을 강조합니다.

Production-Ready AI Agents: 5 Lessons from Refactoring a Monolith developers.googleblog.com

RSS Hunter • 4월 21일

A2UI v0.9: 휴대용, 프레임워크 독립적인 생성형 UI의 새로운 표준

A2UI v0.9는 AI 에이전트가 회사의 기존 디자인 시스템을 사용하여 실시간으로 맞춤형 UI 위젯을 생성할 수 있도록 설계된 프레임워크 독립적인 표준을 도입합니다. 이번 업데이트는 새로운 Python용 Agent SDK, 공유 웹 코어 라이브러리, React, Flutter, Angular와 같은 렌더러에 대한 공식 지원을 통해 개발자 경험을 단순화합니다. UI 의도를 특정 플랫폼에서 분리함으로써, 이 릴리스는 웹 및 모바일 애플리케이션 전반에서 생성적 인터페이스의 원활하고 낮은 지연 시간 스트리밍을 가능하게 합니다. AG2 및 Vercel과 같은 더 넓은 생태계와 통합하여, A2UI v0.9는 생성적 UI를 실험적인 데모에서 프로덕션 준비가 된 디지털 제품으로 전환하는 것을 목표로 합니다.

A2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UI developers.googleblog.com

RSS Hunter • 4월 17일

MaxText, 학습 후 기능 확장: 단일 호스트 TPU에서 SFT 및 RL 도입

MaxText는 JAX와 Tunix 라이브러리를 활용하여 단일 호스트 TPU 구성에서 지도 미세 조정(SFT) 및 강화 학습(RL)에 대한 새로운 지원을 도입했습니다. 이를 통해 개발자는 GRPO 및 GSPO와 같은 효율적인 알고리즘을 사용하여 사전 훈련된 모델을 전문적인 작업과 복잡한 추론에 쉽게 적용할 수 있습니다. 이 업데이트는 후속 훈련 워크플로우를 간소화하여 단일 호스트 설정에서 더 큰 멀티 호스트 구성으로 확장 가능한 경로를 제공합니다.

MaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUs developers.googleblog.com

RSS Hunter • 4월 16일