RSS 클라우드 블로그 노트

RSS 클라우드 블로그

cloud.google.com/blog은 Google Cloud의 공식 블로그입니다. Google Cloud의 제품 및 서비스에 대한 뉴스, 업데이트 및 통찰, 클라우드 컴퓨팅 산업의 트렌드 및 혁신을 제공합니다. 이 블로그는 Google Cloud 전문가, 엔지니어 및 사상가들이 작성한 기사로 구성되어 있습니다. 인공 지능, 머신 러닝, 데이터 분석, 보안 등 다양한 주제를 다루고 있습니다. 기사들은 기술 튜토리얼, 케이스 스터디 및 베스트 프랙티스도 포함하여 Google Cloud를 사용하거나 관심이 있는 개발자, IT 전문가 및 비즈니스 리더에게 귀중한 자원이 됩니다. 블로그는 주제, 제품 및 산업별로 분류되어 있습니다. 방문객은 최신 기사를 브라우징하거나 특정 주제를 검색하거나 블로그의 RSS 피드를 구독하여 최신 뉴스 및 업데이트를 최신 상태로 유지할 수 있습니다. 블로그의 주요 기능 중 일부는 다음과 같습니다. - Google Cloud 제품 및 서비스에 대한 심층 기사, 예를 들어 Google Cloud Platform, Google Cloud Storage 및 Google Cloud AI Platform - Google Cloud 서비스 사용에 대한 기술 튜토리얼 및 가이드 - Google Cloud 고객의 케이스 스터디 및 성공 사례 - 산업 트렌드 및 혁신에 대한 통찰 및 분석 - Google Cloud의 파트너쉽 및 협력에 대한 뉴스 및 업데이트 - Google Cloud 전문가 및 사상가와의 인터뷰 전반적으로 Google Cloud 블로그는 클라우드 컴퓨팅, 인공 지능 및 관련 기술에 관심이 있는 모든 사람에게 귀중한 자원이 됩니다.

노트 스레드

데이터 에이전트의 새로운 기능: AI 워크플로우 강화

일반적인 AI 에이전트는 맥락 이해 부족과 보안 문제로 인해 엔터프라이즈 데이터 처리에 어려움을 겪는 경우가 많습니다. Google의 Agentic Data Cloud는 AI를 운영 및 분석 시스템 전반에 통합하여 이를 해결하는 것을 목표로 합니다. 이 새로운 플랫폼은 에이전트가 높은 정확도와 통합된 거버넌스로 실시간 엔터프라이즈 데이터에 액세스할 수 있는 프레임워크를 제공합니다. 개발 및 사용성을 향상시키기 위해 새로운 도구와 데이터 에이전트가 도입되고 있습니다. BigQuery, Lakehouse, AlloyDB, Spanner 및 Cloud SQL 전반에 걸쳐 대화형 분석이 확장되어 자연어 데이터 상호 작용을 지원합니다. Looker Embedded Conversational Analytics를 통해 에이전트를 사용자 지정 애플리케이션에 직접 통합할 수 있습니다. 데이터 엔지니어, 과학자 및 데이터베이스 관리자를 위한 작업을 자동화하고 인텔리전스를 제공하기 위해 새로운 데이터 에이전트 제품군을 사용할 수 있습니다. 여기에는 데이터 엔지니어링, 데이터 과학, 데이터베이스 관찰 및 데이터베이스 온보딩을 위한 에이전트가 포함됩니다. Looker Dashboard Agent 및 Gemini Enterprise의 대화형 분석은 비즈니스 사용자가 데이터 인사이트에 더 쉽게 액세스할 수 있도록 합니다. Data Agent Kit 및 Managed MCP Servers와 같은 도구는 에이전트 생태계와의 개발자 통합을 지원하기 위해 제공됩니다. 이러한 발전은 조직이 엔터프라이즈 데이터를 사용하여 AI 에이전트를 보다 효과적이고 안전하게 활용할 수 있도록 지원합니다.
CdXz5zHNQW_wVdRRTFqPl.gif

그래프 기술을 활용한 신뢰할 수 있는 에이전트 플랫폼 구축: Yahoo 사례 연구

기업들은 에이전트 AI를 위해 반응형 인텔리전스에서 능동적인 실행 시스템으로 전환하고 있습니다. Google Cloud의 Agentic Data Cloud는 이러한 전환을 가능하게 하며, Yahoo의 Seller Agent 디지털 미디어 구매 플랫폼이 이를 보여줍니다. Yahoo는 Google Cloud와 협력하여 Seller Agent를 구축했으며, 이는 수주가 걸리던 수동 프로세스를 몇 초 만에 실행되는 빠르고 관리되는 캠페인으로 전환했습니다. 이 플랫폼은 자율 시스템이 속도와 책임성을 달성할 수 있는 방법을 보여줍니다. 프리미엄 광고 캠페인과 같은 기존 워크플로우는 비효율적이었으며 광범위한 인간의 개입과 분석이 필요했습니다. 실시간 데이터 및 제약 조건에 대한 결정론적 이해 없이는 단순히 LLM을 통합하는 것만으로는 충분하지 않습니다. 신뢰할 수 있는 에이전트 플랫폼은 오류를 방지하고 사실적 근거를 보장하기 위해 명확한 진실의 원천이 필요합니다. 규제 기관은 실제 예산이 관련된 AI 결정에 대한 설명 가능성을 요구하며, 이는 내장된 거버넌스 및 감사 가능성을 필요로 합니다. Google Cloud에서 실행되는 Yahoo의 Seller Agent는 설명 가능성과 감사 가능성을 위해 설계된 다중 에이전트 시스템입니다. 이 아키텍처는 비즈니스 현실에 대한 결정을 근거로 하는 지식 그래프와 감사 가능한 메모리를 위한 컨텍스트 그래프를 특징으로 합니다. Spanner Graph를 기반으로 하는 지식 그래프는 비즈니스 운영 및 정책을 모델링하여 에이전트가 사실에 기반하여 행동하도록 보장합니다. BigQuery Graph를 활용하는 컨텍스트 그래프는 설명 가능성을 위해 추적 가능한 기록으로 모든 행동을 캡처합니다. 이 이중 그래프 기반은 지식 그래프를 통한 빠른 실행과 컨텍스트 그래프를 통한 지속적인 감사를 가능하게 합니다. 이 아키텍처는 비즈니스 현실에 대한 결정을 근거로 하고 감사 가능한 메모리를 구축하는 신뢰할 수 있는 자율 시스템이 필요한 산업을 위한 청사진 역할을 합니다.
CdXz5zHNQW_9rehc7XuNW.png

클라우드 CISO 관점: AI 위협 방어를 이끈 4가지 교훈

Google Cloud의 새로운 CISO인 Chris Betz는 AI 위협 방어 개발에서 얻은 네 가지 핵심 교훈을 공유했습니다. AI는 취약점 발견을 크게 가속화하여 방어자들이 몇 분 안에 수천 개의 결함을 찾아낼 수 있도록 합니다. 공격자들은 정교한 공격을 위해 AI를 활용하고 있지만, 방어자들은 비즈니스 맥락과 함께 유사한 기능을 사용할 수 있습니다. 레거시 수동 방어는 더 이상 기계 속도의 위협에 충분하지 않습니다. Google의 AI 위협 방어 프레임워크는 준비, 스캔, 수정 및 모니터링을 포함합니다. 준비는 공격 표면을 줄이고 엔지니어링 정렬을 갖춘 강력한 운영 프레임워크를 구축하는 것을 포함합니다. 스캔 및 우선순위 지정은 소프트웨어 공급망에 대한 전문가 주도, AI 지원 분석을 필요로 합니다. 우선순위 지정은 먼저 더 큰 영향 범위를 가진 기반 코드부터 해결하는 것으로 전환됩니다. 수정은 위험 기반 배포, 포괄적인 추적 및 시스템 복원력 구축에 중점을 둡니다. 여기에는 보안 강화를 위해 오픈 소스 소프트웨어를 새로 고치거나, 제거하거나, 다시 작성하는 것이 포함됩니다. 모니터링은 지속적인 피드백 루프를 설정하고, 수정 상태를 추적하며, 미래의 위협 발전에 AI 에이전트를 활용합니다. AI 에이전트는 응답 플레이북을 자동화하고 코딩 관행을 개선하며, 레드 팀은 인프라를 스트레스 테스트합니다. 이 접근 방식은 끊임없이 진화하고 안전한 방어를 보장합니다.
CdXz5zHNQW_hQrhUBcQRP.png

중국 연계 위협 행위자, 인공지능, 사이버, 의료 및 국방 연구 추구하며 공공 및 민간 의료 커뮤니티 표적으로 삼아

정교한 중국 연계 위협 행위자인 UNC6508이 북미의 학술, 의료 및 군사 연구 기관을 표적으로 삼고 있습니다. 이 행위자는 1년 이상 탐지되지 않고 웹 애플리케이션을 침해하고 INFINITERED라는 맞춤형 멀웨어를 배포했습니다. UNC6508은 국가 안보 정보 및 첨단 연구를 포함한 민감한 데이터를 훔치는 것을 목표로 했습니다. 주요 방법은 취약한 REDCap 서버를 악용하여 로그인 자격 증명을 가로채는 것이었습니다. 액세스 권한을 얻은 후, 행위자는 내부 시스템으로 이동하여 데이터 유출을 위한 새로운 기술을 사용했습니다. Google Threat Intelligence Group(GTIG)은 악성 인프라를 중단시키고 영향을 받은 조직에 통지했습니다. GTIG는 2단계 인증 활성화와 보안 모범 사례 사용을 권장합니다. INFINITERED는 드로퍼, 자격 증명 수집기 및 백도어를 포함하는 모듈식 접근 방식을 사용합니다. REDCap 업그레이드 프로세스에 코드를 주입하여 지속성을 유지합니다. 자격 증명 수집기는 로그인 세부 정보를 캡처하여 암호화된 데이터베이스에 저장합니다. 백도어는 데이터 도난 및 시스템 제어를 위한 명령 실행을 허용합니다. 위협 행위자는 또한 은밀한 데이터 유출을 위해 도메인 콘텐츠 규정 준수 규칙을 조작했습니다. GTIG는 Mandiant Consulting 및 기타 Google 팀과 협력하여 포괄적인 위협 인텔리전스 및 복구 지원을 제공했습니다.
CdXz5zHNQW_Kt1CMvP0Cs.png

Antigravity 2.0와 함께 하루 만에 Go를 배운 방법과 당신도 그렇게 할 수 있는 방법

저자는 리소스 집약적인 Node.js 도구를 성능이 뛰어난 Go CLI로 대체하고자 했습니다. 그들은 제로 의존성 코어, 속도, 제로 트러스트 보안 모델을 포함한 아키텍처 목표를 정의했습니다. Rust, Python, Zig, Swift와 같은 대안을 고려한 후, Go는 기능의 균형을 위해 선택되었습니다. AI 에이전트가 기존 코드 감사를 지원하고 직접적인 Go 포트가 존재하지 않음을 확인했습니다. 프로젝트는 커뮤니티 표준 코딩 관행을 보장하기 위해 인기 있는 Go 에이전트 스킬을 설치하는 것으로 시작되었습니다. 이후 아키텍처 목표가 개선되고 AI 에이전트가 마이그레이션을 계획하는 격차 분석이 이어졌습니다. 마이그레이션에는 TypeScript 구성을 Go로 번역하고 다양한 에이전트 디렉토리를 매핑하는 작업이 포함되었습니다. 사용자 온보딩 로직은 별도의 파일로 분리되었습니다. 기능적 동등성을 보장하기 위해 테스트 주도 개발(TDD) 루프가 구현되었습니다. AI는 프로덕션 코드를 작성하기 전에 테스트를 생성했으며, 프론트매터 파싱부터 시작했습니다. 오류 처리는 Go 모범 사례에 맞춰 명시적인 오류 확인과 컨텍스트 래핑을 보장했습니다. 단위 테스트는 다양한 시나리오를 다루기 위해 엔드투엔드 통합 테스트로 보완되었습니다. CLI 명령의 넓은 표면적을 관리하기 위해 각 에이전트가 단일 명령에 집중하는 병렬 서브 에이전트가 활용되었습니다. 이 접근 방식은 누락된 옵션과 테스트를 식별하는 데 도움이 되었습니다. "코끼리와 금붕어" 아키텍처 패턴이 사용되었으며, 영구 코디네이터 에이전트와 특정 작업을 위한 일시적인 서브 에이전트가 사용되었습니다. Go 패키지 구조가 최종 확정되어 네이티브 설치를 지원했습니다. 크로스 플랫폼 호환성을 보장하기 위해 매트릭스 빌드를 사용하여 CI/CD 파이프라인이 설정되었습니다. Go로 마이그레이션했음에도 불구하고 파이프라인은 GitHub Actions 도우미를 위해 Node.js 종속성을 유지했습니다. 최종 고려 사항에는 사전 컴파일된 바이너리를 배포하기 위한 코드 서명이 포함되었습니다.
CdXz5zHNQW_rpTWrPGL8F.jpeg

오픈 지식 포맷 소개

파운데이션 모델은 특히 에이전트 기반 시스템에서 효과적으로 작동하기 위해 적절한 맥락 정보가 필요합니다. 기업들은 다양한 시스템에 흩어져 있는 내부 지식으로 인해 분산된 환경에 직면해 있습니다. 이를 해결하기 위해 오픈 지식 포맷(OKF)이 개방형 사양으로 도입되었습니다. OKF는 LLM-위키 패턴을 이식 가능하고 상호 운용성이 뛰어나며 벤더 중립적인 형식으로 정형화합니다. 이 형식은 상호 운용성을 위해 간단한 규칙을 사용하여 지식을 YAML 프론트매터가 포함된 마크다운 파일 디렉토리로 표현합니다. 이를 통해 다양한 제작자와 에이전트가 별도의 변환 과정 없이 지식을 활용할 수 있습니다. OKF는 최소한의 설계 관점을 반영하여 제작자와 소비자의 독립성을 보장하고, 독점 플랫폼보다 포맷 자체를 우선시하도록 설계되었습니다. 각 개념은 파일 경로로 식별되는 마크다운 파일로, 구조화된 필드에는 YAML 프론트매터를, 본문에는 마크다운을 사용합니다. 개념들은 마크다운을 통해 서로 연결되어 관계 그래프를 형성합니다. 참조 구현체에는 보강 에이전트와 정적 HTML 시각화 도구가 포함됩니다. 이 형식은 커뮤니티의 기여를 통해 발전해 나갈 예정입니다. Google Cloud의 Knowledge Catalog도 OKF를 도입할 예정입니다. 궁극적으로 OKF는 AI 애플리케이션에서 지식을 교환하기 위한 공통 언어가 되는 것을 목표로 합니다.

기밀 AI의 차세대 시대를 열다

Google Cloud는 Apple과 협력하여 확장된 Private Cloud Compute(PCC) 시스템을 지원합니다. 이 협력은 Google Cloud의 고급 보안 및 개인 정보 보호 기술을 활용합니다. 이 파트너십의 핵심은 데이터의 전체 수명 주기를 보호하는 Google Cloud의 Confidential Computing 포트폴리오입니다. Titan 칩을 특징으로 하는 Titanium 보안 아키텍처는 Google 인프라를 위한 하드웨어 루트 오브 트러스트를 제공합니다. Confidential Computing은 사용 중인 데이터조차 암호화하기 위해 Trusted Execution Environments(TEEs)를 활용합니다. Apple의 PCC는 Intel TDX 및 NVIDIA Confidential Computing으로 구동되는 이러한 TEE에 의존합니다. 이 하드웨어 기반 격리는 민감한 AI 워크로드를 위한 매우 안전하고 개인적인 환경을 보장합니다. Google Titan 칩은 PCC를 위한 하드웨어 플랫폼의 무결성을 확립하는 데 필수적입니다. 이 협력에는 투명성을 높이고 보안 속성을 독립적으로 검증하기 위한 오픈 소스 호스트 스택도 포함됩니다. 이 공동 노력은 PCC에 대한 Apple의 엄격한 개인 정보 보호 및 보안 요구 사항을 충족하도록 설계된 강력하고 검증 가능한 시스템을 만듭니다. 이러한 발전은 모든 Google Cloud 고객, 특히 민감한 AI 데이터를 다루는 고객에게 이익이 될 것입니다.

Looker 에이전트로 대시보드를 인터랙티브한 데이터 경험으로 전환하세요

전통적인 대시보드는 유용하지만 상호작용성이 부족하고 사용자가 후속 질문을 하는 것을 방해합니다. 이는 종종 워크플로우를 중단시키거나 데이터 분석가의 지원을 필요로 합니다. 이를 해결하기 위해 Looker는 미리보기 버전으로 대시보드 에이전트를 도입하여 대시보드 내에서 직접 대화형 데이터 탐색을 가능하게 합니다. 이제 사용자는 자연어를 사용하여 비즈니스 인텔리전스 데이터와 상호 작용할 수 있습니다. Gemini 아이콘을 클릭하면 사용자는 대화를 시작하고 맥락에 맞는 인사이트를 얻을 수 있습니다. 에이전트는 적용된 필터, 교차 필터 및 큐레이션된 타일을 활용하여 매우 관련성 높은 답변을 제공합니다. 더 많은 정보가 필요한 경우 에이전트는 더 깊은 인사이트를 위해 기본 Explores에 액세스할 수 있으며, 차트와 설명과 함께 제공됩니다. 데이터 분석가는 자연어 지침을 제공하여 에이전트의 응답을 맞춤 설정할 수 있으며, 특정 대상에 대해 비즈니스 로직을 정확하게 해석하도록 보장합니다. 이러한 셀프 서비스 기능은 분석가 팀이 노력을 확장하는 데 도움이 됩니다. 대시보드 에이전트는 또한 추론, 참조된 타일 및 적용된 필터를 표시하여 신뢰성과 투명성을 보장합니다. 기존 Looker 거버넌스 모델 내에서 작동하며 사용자 권한을 존중합니다. 관리자는 Gemini in Looker 설정에서 Looker 버전 26.08.11 이상에서 이 기능을 활성화할 수 있습니다.
CdXz5zHNQW_yizylgs7nw.gif

ShinyHunters, Oracle PeopleSoft 취약점 이용해 교육계 노려

Mandiant와 Google 위협 인텔리전스 그룹은 Oracle PeopleSoft 인프라를 대상으로 하는 UNC6240, 즉 ShinyHunters로 알려진 그룹의 활발한 갈취 캠페인을 보고했습니다. 공격자들은 2026년 5월 27일부터 6월 9일 사이에 Environment Management 구성 요소의 치명적인 제로데이 원격 코드 실행 취약점인 CVE-2026-35273을 악용했습니다. Google은 잠재적인 침해 가능성에 대해 주로 고등 교육 기관인 100개 이상의 조직에 통지했습니다. 스테이징 서버의 공개된 공격자 디렉터리는 클라우드 엔드포인트로 위장한 맞춤형 MeshCentral 에이전트를 드러냈습니다. 이러한 에이전트는 맞춤형 측면 이동 및 변조 스크립트인 [victim_abbreviation]_fanout.sh를 배포하는 데 사용되었습니다. 이 활동은 2026년 6월 9일에 ShinyHunters 데이터 유출 사이트에 게시된 데이터 유출과 직접적으로 관련이 있습니다. 스테이징 인프라는 Microsoft Azure 서비스로 위장한 사전 구성된 Windows MeshCentral 에이전트를 호스팅했습니다. 명령 기록 분석 결과 공격자들이 스테이징 환경을 구성하고, PeopleSoft 구성을 매핑하고, 측면 이동을 위한 스크립트를 전파하는 것으로 나타났습니다. 이 스크립트는 내부 호스트에 대해 SSH 자격 증명을 살포하고 변조 표시기를 배포했습니다. Oracle PeopleSoft를 실행하는 조직은 /PSEMHUB/hub 및 /PSIGW/HttpListeningConnector와 같은 민감한 엔드포인트에 대한 외부 네트워크 액세스를 즉시 차단하는 것이 좋습니다. 또한 의심스러운 POST 요청에 대한 액세스 로그 감사 및 아웃바운드 SMB 트래픽 모니터링이 권장되는 보안 조치입니다.
CdXz5zHNQW_SKa3xYLQeY.png

우리 팀이 없이는 구축하지 않기로 거부하는 10가지 필수 프롬프트

숙련된 빌더는 즉흥적으로 작업하지 않습니다. 일관되고 고품질의 작업을 위해 정제된, 자주 사용하는 프롬프트에 의존합니다. 이러한 프롬프트는 코딩 전에 인간의 가정을 위험에서 벗어나게 하고 아이디어를 스트레스 테스트하는 도구 역할을 합니다. Maja Bilić는 냉소적인 건축가를 구현하는 프롬프트를 사용하여 제품 요구 사항을 개선하고 과도한 엔지니어링을 방지합니다. Andrew Brogdon은 종종 간과되는 위젯 테스트에 AI를 활용하여 죄책감을 줄이고 코드베이스의 신뢰성을 향상시킵니다. Aja Hammerly는 코드를 검토 제출하기 전에 잊혀진 TODO를 찾고 커밋 메시지를 정리하는 프롬프트를 사용합니다. Rich Hyndman은 앱 권한을 확인하고 사용되지 않는 권한을 식별하는 프롬프트를 사용하여 Play 스토어 규정 준수에 중요합니다. Shir Meir Lador의 프롬프트는 AI를 혹독한 코드 검토에 참여시켜 정중한 제안 대신 심각한 결함을 식별합니다. James O'Reilly는 트레이드오프를 탐색하는 프롬프트를 사용하여 AI에 집중하고 개발자가 의사 결정을 통제하도록 합니다. Emma Twersky는 프롬프트를 사용하여 AI 생성 코드의 취약점을 식별하는 체크리스트를 생성하여 신뢰 불일치를 방지합니다. Fred Sauer는 일련의 프롬프트를 사용하여 검색, 개념 증명, 평가 및 개선 단계를 반복합니다. Remigiusz Samborski는 자동화된 풀 리퀘스트 검토를 위해 GitHub Actions에 프롬프트를 포함시켜 인간 검토자가 더 높은 수준의 작업에 집중할 수 있도록 합니다. Karl Weinmeister는 DAG 분석을 사용하여 AI에 구조적 테스트를 요청하고 중요한 경계에 집중하며 개선 사항의 우선순위를 정합니다. 이러한 필수 프롬프트는 AI를 적대적인 사상가로 변환하여 개발자가 더 큰 확신을 가지고 출시할 수 있도록 합니다.

심층 분석: Lightning Engine이 Apache Spark 성능을 4.9배 더 빠르게 제공하는 방법

Apache Spark는 글로벌 데이터 처리를 위한 핵심 기술이지만, 데이터 볼륨을 확장하면 성능 및 비용 절충이 발생할 수 있습니다. 수많은 동시 쿼리를 포함하는 에이전트 시대는 이러한 병목 현상을 악화시키고 단위 경제에 영향을 미칩니다. Managed Service for Apache Spark는 이제 기존 Spark 워크로드와 호환되는 성능 향상 기능인 Lightning Engine을 제공합니다. 이 엔진은 서버리스 및 관리형 클러스터 배포 모드 모두에서 사용할 수 있으며, 작업 실행을 가속화하는 통합 솔루션을 제공합니다. Lightning Engine은 표준 Spark보다 최대 4.9배 빠른 상당한 성능 향상을 보여주었으며, 대안보다 우수한 가격 대비 성능을 제공합니다. 핵심 혁신은 벡터화된 네이티브 실행에 있으며, Spark 계획을 최적화된 C++ 명령으로 컴파일하여 JVM 오버헤드를 우회합니다. 이는 벡터화된 정렬, 가속화된 윈도우 함수 및 지원되지 않는 연산자에 대한 스마트 폴백 메커니즘을 통해 달성됩니다. 또한 Lightning Engine은 클라우드 스토리지 및 BigQuery 커넥터를 최적화하여 데이터 검색 속도를 높입니다. 단일 해시 테이블 캐싱 및 집계 푸시다운과 같은 고급 쿼리 최적화 기능도 자랑합니다. Google Cloud 콘솔 또는 gcloud CLI를 통해 Lightning Engine을 활성화하는 옵션을 통해 시작하는 것이 간단합니다. 이 릴리스는 Spark를 활용하는 새롭고 지능적이며 더 빠른 방법을 의미합니다.
CdXz5zHNQW_gyIAmWSUK1.jpeg

표면 선택: Antigravity 2.0, Antigravity CLI, Antigravity IDE 또는 Antigravity SDK

Antigravity는 공유된 기본 하네스에 의해 구동되는 자율 에이전트 오케스트레이션을 위한 네 가지 고유한 인터페이스를 제공합니다. Antigravity 2.0은 독립적인 프로젝트 전반에 걸쳐 여러 작업을 동시에 관리하는 데 이상적인 데스크톱 앱으로, 사용자가 메인 작업 공간을 방해하지 않고 작업을 모니터링하고 예약할 수 있습니다. 명령줄 애호가 및 헤드리스 실행 시나리오의 경우 Antigravity CLI는 빠르고 터미널 기반 경험을 제공합니다. 에이전트와 직접 함께 작업하고 코드 변경 사항을 한 줄씩 검토하려는 개발자는 통합 디버깅 및 원클릭 수정 기능을 제공하는 Antigravity IDE를 특히 유용하게 사용할 것입니다. Python 라이브러리인 Antigravity SDK는 사용자가 자체 맞춤형 에이전트를 구축하고 배포할 수 있도록 지원합니다. 이 SDK는 Google의 공식 Antigravity 도구를 구동하는 것과 동일한 도구 및 규칙에 대한 액세스를 제공하여 로컬 개발 및 Google Cloud로의 원활한 배포를 가능하게 합니다. 모든 인터페이스는 플러그인 및 스킬을 지원하여 선택한 표면에 관계없이 핵심 로직에 대한 일관된 액세스를 보장합니다. 사용자는 자신의 워크플로 및 프로젝트 요구 사항에 가장 적합한 도구를 선택할 수 있습니다. 추가 지침 및 문서는 antigravity.google 웹사이트에서 확인할 수 있으며, 다운로드는 전용 페이지에서 액세스할 수 있습니다.
CdXz5zHNQW_f0XTUFrYdX.png

Claude Fable 5: Google Cloud에서 사용 가능

Claude Fable 5, Anthropic의 최신 프론티어 모델이 Google Cloud에서 일반에 공개되었습니다. 이번 출시는 업계 최신 모델을 Agent Platform에 바로 제공하려는 저희의 지속적인 노력의 최신 증거입니다. Claude Fable 5는 일반 사용에 안전하도록 설계된 강력한 안전 장치를 갖추고 Anthropic 모델의 최고 기능을 모든 고객에게 제공합니다. 복잡하고 다단계적인 추론을 위해 설계된 Claude Fable 5는 고급 소프트웨어 개발, 장기 에이전트, 심층 멀티모달 문서 분석과 같은 까다로운 작업에 적합합니다. 이 릴리스에 대한 자세한 내용은 Anthropic 블로그를 방문하십시오. 지금 Agent Platform에서 Claude Opus 4.8 및 Claude Sonnet 4.6을 포함한 Anthropic의 다른 모델과 Claude Fable 5를 사용하여 구축하십시오.

Gemini for Government: 임무 영향력을 위한 청사진

공공 부문은 AI 실험 단계에서 영향력 있는 애플리케이션으로 전환하고 있으며, 개별 모델을 넘어선 통합 솔루션을 요구하고 있습니다. Google Cloud는 에이전트 시대에 이러한 전환을 달성하기 위한 통합 AI 스택을 제공합니다. 이 스택은 규모에 최적화되고 TPU와 같은 고급 인프라로 구동되는 AI Hypercomputer를 기반으로 구축됩니다. Gemini 3.5를 포함한 Google의 최첨단 모델과 타사 옵션을 통해 지능을 제공합니다. 에이전트 데이터 클라우드는 신뢰할 수 있는 조직 데이터에 AI를 기반으로 하여 Cross-cloud Lakehouse와 같은 혁신을 통해 "행동 시스템"을 가능하게 합니다. 에이전트 방어는 AI 위협 방어로 강화된 전체 AI 수명 주기에 대한 제로 트러스트 보호를 제공합니다. Gemini Enterprise Agent Platform은 에이전트 구축, 확장 및 거버넌스를 촉진하며, Workspace Intelligence와 같은 사전 구축된 전문 에이전트를 즉시 사용할 수 있습니다. 보안은 AI 제어 대시보드, 에이전트 레지스트리 및 포괄적인 보호를 위한 모델 아머를 특징으로 하는 최우선 과제입니다. Gemini for Government는 FedRAMP High 승인 및 데이터 개인 정보 보호 보장을 자랑하며, AI 생성 코드 보안을 위한 새로운 도구를 제공합니다. 에이전트 확장은 비기술 사용자가 노코드 인터페이스를 통해 에이전트를 구축할 수 있도록 하는 Agent Designer와 같은 도구를 통해 달성됩니다. 이 이니셔티브는 작업을 자동화하고 생산성을 높이며 인력이 중요한 업무에 집중할 수 있도록 하는 것을 목표로 합니다. 공공 부문 팀은 이미 생성형 AI를 통해 상당한 생산성 향상을 경험하고 있으며, 많은 팀이 직원 생산성이 최소 두 배가 되었다고 보고하고 있습니다. Gemini for Government는 파일럿을 넘어 확장 가능하고 임무를 발전시키는 애플리케이션으로 나아갈 수 있는 청사진을 제공합니다. 이 기술은 인간의 역량을 증폭시키고 의사 결정을 가속화합니다.
CdXz5zHNQW_omvR9Ok88T.png

Storage Insights 데이터셋: 활동 인사이트를 통한 조직 전체의 운영 탐색 지원

AI 워크로드는 스토리지를 수동적인 저장소에서 능동적인 데이터 플랫폼으로 변화시키고 있습니다. 수십억 개의 비정형 데이터 객체와 관련 작업은 데이터 액세스, 이동 및 수정에 대한 고급 이해를 필요로 합니다. Google Cloud Storage Insights 데이터셋은 이제 활동 인사이트를 제공하여 Cloud Storage 애셋의 운영 세부 정보에 대한 가시성을 제공합니다. 이러한 새로운 뷰는 관리자가 데이터 기반 비용 최적화를 수행하고 문제 해결 속도를 높일 수 있도록 합니다. 예를 들어, 사용자는 객체가 올바른 스토리지 클래스에 있는지 또는 버킷 리전이 최적으로 위치해 있는지 확인할 수 있습니다. 스토리지 환경 전반의 운영 오류를 식별하고 근본 원인을 이해하는 것이 더 관리 가능해집니다. Storage Insights 데이터셋은 일일 메타데이터와 빈번한 활동 인사이트를 제공하며, 일반적으로 4시간 이내에 제공됩니다. 이러한 인사이트는 수동 데이터 수집을 대체하는 쿼리 준비된 BigQuery 인덱스로 제공됩니다. 이 데이터셋은 객체 수준 활동, 버킷 수준 집계 활동, 지역 트래픽 및 프로젝트 수준 집계 활동을 제공합니다. 이를 통해 정적 스냅샷을 넘어 데이터 수명 주기를 동적으로 분석할 수 있습니다. 활동 인사이트는 활용도가 낮은 데이터를 식별하여 스토리지를 적절하게 조정하는 데 사용할 수 있습니다. 또한 지역 트래픽 패턴을 분석하여 글로벌 성능을 위한 아키텍처링을 지원합니다. 또한 이러한 인사이트는 오류 코드 급증과 같은 운영 핫스팟을 파악하고 해결하는 데 도움이 됩니다.
CdXz5zHNQW_bsDbZO9A6w.png

소프트웨어 개발에서 진정한 ROI를 잠금 해제하는 방법 – 최신 DORA 연구 심층 분석

생성형 AI의 비즈니스 가치를 입증하기 위해 기술 및 금융 리더는 지속적인 자금 지원에 대한 명확한 투자 수익률(ROI)을 보여주어야 합니다. 성공은 AI 구현에 필요한 조직 시스템 및 문화를 구축하는 데 달려 있습니다. DORA: AI 지원 소프트웨어 개발의 ROI 보고서는 초기 채택의 어려움을 겪는 팀을 위한 실용적인 접근 방식을 제공합니다. 주요 결과는 AI 가치 실현에 대한 현실적인 기대치의 중요성을 강조하며, 이는 종종 J-커브를 따릅니다. 이 J-커브는 학습 곡선, 검증 세금 및 파이프라인 적응으로 인한 일시적인 생산성 하락을 포함합니다. 이 초기 학습 단계를 위한 예산 책정은 지속적인 발전에 매우 중요합니다. 이 보고서는 또한 AI 수익률의 시장 분할을 보여주며, 조직 지원이 성공에 큰 영향을 미칩니다. 소프트웨어 개발 수명 주기 전반에 걸쳐 비용 절감, 생산성 향상 및 보안 개선과 같은 영역에 초점을 맞춰 AI ROI를 계산하는 것이 필수적입니다. 대화형 ROI 계산기를 사용하여 AI 채택의 예상 비용과 현실을 예측할 수 있습니다. 리더는 전체 보고서를 다운로드하고 계산기를 사용하여 AI 투자를 위한 방어 가능한 비즈니스 사례를 구축할 수 있습니다.
CdXz5zHNQW_JeLAU2eN3Q.jpeg

보고서: GKE Inference Gateway, AI 응답 최대 92% 더 빠르게 제공

생성형 AI의 프로덕션 환경은 인프라 효율성을 요구하며, GKE Inference Gateway는 AI 워크로드를 지능적으로 라우팅하는 솔루션을 제공합니다. 이는 기본적인 로드 밸런싱을 넘어 프리픽스 캐싱 및 모델 인식 라우팅과 같은 고급 기능을 활용합니다. 이를 통해 요청은 이미 준비된 가속기로 전달되어 하드웨어 활용도와 응답 시간을 최적화합니다. 독립적인 벤치마크 결과, GKE Inference Gateway는 처리량, 첫 토큰까지의 시간, 토큰 간 지연 시간에서 경쟁사보다 훨씬 뛰어난 성능을 보였습니다. Snap Inc. 또한 높은 프리픽스 캐시 히트율과 기존 인프라와의 원활한 통합을 달성하며 성공을 거두었습니다. 프리픽스 캐싱은 반복적인 프롬프트 프리픽스의 활성화 상태를 저장하여 중복 재처리를 제거하는 방식으로 작동합니다. 이는 검색 증강 생성(retrieval-augmented generation)을 사용한 문서 및 코드베이스 Q&A에 특히 유용합니다. 마찬가지로, 다중 턴 채팅 시나리오에서는 시스템 페르소나 및 비즈니스 규칙을 캐싱하여 지속적인 응답성을 가능하게 합니다. 이 기술은 LLM이 각 쿼리에 대해 정적 컨텍스트를 재평가할 필요성을 우회합니다. GKE의 우수한 성능은 표준 관리형 Kubernetes 서비스와 비교한 벤치마크 보고서에서 검증되었습니다. 결과는 GKE의 처리 속도 및 지연 시간의 상당한 개선을 강조했습니다. 지연 시간을 최소화하고 효율성을 극대화함으로써 GKE Inference Gateway는 생성형 AI 애플리케이션을 프로덕션 준비 상태로 만들고 비용 효율적으로 만듭니다.
CdXz5zHNQW_Q5fGhEs1eh.jpeg

Google Security Operations 에이전트를 이용한 AI 기반 위협 탐지 및 차단

조직은 AI 가속화된 적들로부터 증가하는 위협에 직면하고 있으며, 이에 따라 더 빠른 대응 시간이 필요합니다. Google AI Threat Defense는 이러한 AI 기반 위협에 맞서기 위해 설계된 자동화 시스템입니다. 이 시스템은 준비, 스캔 및 우선순위 지정, 해결, 모니터링의 네 단계 프레임워크로 운영됩니다. Google Security Operations는 AI Threat Defense와 협력하여 특히 패치 불가능한 코드를 포함하는 위협을 모니터링, 탐지 및 대응합니다. 취약점 악용은 이제 가장 흔한 초기 감염 벡터이며, 악용은 종종 패치가 제공되기 전에 발생합니다. Google Security Operations는 전체 환경에 걸쳐 활성 공격을 자율적으로 격리하기 위한 운영 프레임워크를 제공합니다. 지속적인 분석, 자율 조사 및 대응, 소급 사냥을 통해 환경 전반의 가시성을 제공합니다. Detection Engineering 에이전트는 새로운 악용 패턴을 사용자 지정 탐지로 변환하고 다양한 입력 소스를 분석하여 악의적인 활동을 식별합니다. Triage and Investigation 에이전트는 경고를 자율적으로 조사하여 분석 시간을 몇 분에서 몇 초로 단축합니다. Agentic automation은 AI 에이전트와 플레이북을 결합하여 공격을 격리하며, 분석가는 워크플로를 자동화하는 동안 통제력을 유지할 수 있습니다. Threat Hunting 에이전트는 기존 방어를 우회하는 은밀한 적의 행동과 이상 징후를 사전에 사냥할 수 있도록 합니다. 이러한 에이전트를 통합함으로써 조직은 기계 속도로 탐지를 자율적으로 생성하고, 격리를 조정하며, 위협을 사냥하여 침해 위험과 비용을 크게 줄일 수 있습니다.
CdXz5zHNQW_UNHT6iJl7X.png

현대적인 의료 서비스: Alcidion이 AlloyDB로 안정성과 성능을 향상시킨 방법

스마트 헬스 솔루션 제공업체인 Alcidion은 임상의의 인지 부하를 줄이고 중요한 정보를 적시에 제공하는 것을 목표로 합니다. 그들의 주력 플랫폼인 Miya Precision은 환자 흐름을 관리하고 부정적인 결과를 예방하는 데 도움이 됩니다. 이전에는 Alcidion이 Microsoft SQL Server 환경에서 성능 병목 현상과 운영 오버헤드에 직면했으며, 특히 복잡한 JSON 데이터 처리 및 안정성 문제에 어려움을 겪었습니다. 이러한 문제를 해결하기 위해 Alcidion은 플랫폼을 Google Cloud의 AlloyDB for PostgreSQL로 마이그레이션했습니다. Google Cloud의 Database Migration Service를 활용한 마이그레이션은 효율적으로 완료되었으며, 핵심 이전 작업은 일주일이 조금 넘게 소요되었습니다. Alcidion은 사용자 정의 동기화 도구를 만들고 관리형 Google Cloud 서비스를 활용하여 15분이라는 짧은 전환 시간을 달성했습니다. 이 전환은 데이터베이스 관리와 관련된 제어 평면 작업 및 관리 오버헤드를 제거했습니다. 결과는 상당했으며, 데이터 처리 시간은 30분에서 1분 미만으로 단축되었습니다. 안정성이 극적으로 향상되어 팀은 인프라 문제에 대한 끊임없는 "긴급 대응"에서 벗어날 수 있었습니다. 이러한 이전은 SRE 팀의 관리 부담을 줄여 제품 혁신에 집중할 수 있도록 했습니다. Alcidion은 이러한 현대화를 향후 성장을 위한 기반 단계로 보고 있으며, AlloyDB의 컬럼형 엔진 탐색 및 생성형 AI 통합을 포함합니다. 이러한 전략적 움직임은 Alcidion이 전 세계적으로 더 스마트하고 안전한 의료 솔루션을 지속적으로 제공할 수 있도록 합니다.

상담 요청: 미국 로펌을 겨냥한 지속적인 표적 캠페인

재정적 동기를 가진 데이터 절취 및 갈취 캠페인을 수행하는 위협 클러스터 UNC3573이 전문 서비스, 법률 서비스, 금융 서비스 분야의 조직을 표적으로 삼았습니다. UNC3573은 IT 지원을 사칭하여 음성 피싱 및 사회 공학 기법을 사용하여 원격 액세스를 확보합니다. 피해자들을 설득하여 화면 공유를 유도하고 원격 모니터링 도구를 다운로드하게 하여 민감한 데이터를 찾아내고 유출합니다. 일부 사례에서는 위협 행위자들이 IT 기술자를 사칭하여 사무실에 물리적으로 접근하여 USB 드라이브를 통해 데이터를 훔치기도 했습니다. 캠페인 라이프사이클은 빠르며, 많은 경우 하루 업무일 내에 데이터 절취 및 갈취가 발생합니다. 초기 액세스는 일반적으로 보안 우려를 제기하도록 설계된 정상적인 송장 테마 이메일을 통해 이루어지며, 이후 직접적인 보이스 피싱 전화가 이어집니다. 위협 행위자들은 Zoom, Teams, RMM 에이전트와 같은 합법적인 도구를 악용하고, 명령 및 링크를 전달하기 위해 자체 파괴되는 메모를 사용합니다. 또한 BYOD 환경을 악용하여 기업 네트워크로 침투하고 특정 민감 파일을 대상으로 문서 관리 시스템을 공격합니다. 데이터 유출 방법에는 클라우드 스토리지 업로드, FTP 유틸리티 사용, 피해자에게 탈취된 파일을 이메일로 보내도록 지시하는 것 등이 포함됩니다. 갈취 통신은 공격적이며, 3일 이내에 몸값을 요구하고 데이터를 공개적으로 유출하고 직원 및 고객에게 연락하겠다고 위협합니다.
CdXz5zHNQW_YqBOAUO037.png

Managed Service for Apache Spark 클러스터의 새로운 기능

Google Cloud의 Dataproc, 현재 Apache Spark용 관리형 서비스는 애드혹 작업용 서버리스와 맞춤형 요구사항용 관리형 클러스터의 두 가지 배포 모드를 제공합니다. 관리형 클러스터는 속도, 사용 편의성 및 지능에 중점을 두고 재구상되었습니다. 중요한 개선 사항은 Spark DataFrame 및 SQL 쿼리를 극적으로 가속화하는 네이티브 C++ 실행 엔진인 Lightning Engine입니다. 이 엔진은 코드 변경 없이 최대 4.9배 더 빠른 성능과 개선된 가격 대비 성능을 제공합니다. 유연한 VM은 순위가 지정된 머신 유형 선호도를 허용하여 클러스터 복원력을 향상시키기 위해 도입되었습니다. 제로 스케일 클러스터 및 예약된 중지와 같은 FinOps 기능은 개발 환경에 대한 더 나은 비용 제어를 제공합니다. MCP 서버는 생성형 AI를 통합하여 AI 어시스턴트가 자연어를 사용하여 Spark 클러스터와 상호 작용하여 작업을 수행할 수 있도록 합니다. Data Agent Kit는 데이터 과학자가 Gemini와 같은 도구와 통합하여 선호하는 개발 환경 내에서 전체 데이터 워크로드 수명을 관리할 수 있도록 합니다. 차세대 Lakehouse는 Spark와 BigQuery 간의 원활한 상호 운용성을 제공하며 클라우드 스토리지 또는 원격 AWS 데이터 세트에서 직접 데이터를 처리합니다. Spark 4.1 및 Java 21을 갖춘 Cluster Image 3.0은 지속적이고 낮은 지연 시간 처리를 위한 실시간 스트리밍 기능을 도입합니다. 이러한 업데이트는 Google Cloud 콘솔 및 gcloud CLI를 통해 액세스할 수 있는 관리형 Spark 클러스터에 대해 현재 사용할 수 있습니다.
CdXz5zHNQW_lTUdK8PnPj.jpeg

AI 에이전트 확장: GKE Autopilot에 ADK 배포를 위한 단계별 가이드

이 튜토리얼은 Google Agent Development Kit(ADK) 에이전트를 Google Kubernetes Engine(GKE) Autopilot에 배포하는 과정을 안내합니다. ADK 에이전트를 Artifact Registry에 저장된 Docker 이미지로 패키징하고 GKE Autopilot에서 실행하는 아키텍처를 설명하는 것으로 시작합니다. 에이전트는 안전한 권한 관리를 위해 Workload Identity를 사용하여 Vertex AI와 통신합니다. 사전 요구 사항에는 Python, gcloud SDK, kubectl 및 특정 API 활성화가 포함됩니다. 초기 단계에는 인증하고 프로젝트를 설정하는 Google Cloud 환경 구성이 포함됩니다. 다음으로, 에이전트를 빌드하는 동안 백그라운드에서 실행되는 GKE Autopilot 클러스터를 프로비저닝합니다. ADK 에이전트는 CLI를 사용하여 생성되고 Vertex AI의 Gemini를 사용하도록 구성됩니다. 배포 전에 에이전트의 기능을 보장하기 위해 웹 UI를 통해 로컬에서 테스트됩니다. 배포를 위해 Dockerfile을 생성하고 이미지를 빌드하여 Artifact Registry에 푸시함으로써 ADK 에이전트를 컨테이너화합니다. 그런 다음 IAM 서비스 계정을 생성하고 필요한 Vertex AI 역할을 부여하여 Workload Identity를 구현합니다. 그런 다음 Workload Identity에 주석이 달린 Service Account, 에이전트용 Deployment 및 내부적으로 노출하기 위한 Service를 포함한 Kubernetes 리소스를 생성합니다. kubectl을 사용하여 GKE에 에이전트를 배포하고 상태를 확인합니다. 배포된 에이전트와의 상호 작용은 API에 대한 `curl` 명령을 통해 시연됩니다. 선택적으로, 안전한 HTTPS 액세스를 위해 Google 관리 TLS 인증서를 사용하여 GKE Gateway API를 통해 에이전트를 외부로 노출할 수 있습니다. 여기에는 정적 IP 예약, SSL 인증서 생성 및 Gateway 및 HTTPRoute 리소스 정의가 포함됩니다.

서버리스 Managed Service for Apache Spark의 새로운 기능

대규모 Apache Spark 실행은 상당한 리소스와 전문적인 관리를 요구합니다. Google Cloud의 서버리스 Managed Service for Apache Spark, 특히 3.0 런타임 버전은 속도, 단순성 및 안정성을 우선시하여 이를 간소화하는 것을 목표로 합니다. 데이터 과학을 위한 이 서비스의 고객 사용량은 전년 대비 거의 두 배로 증가하여 채택이 늘어나고 있음을 나타냅니다. 이 서비스는 제로 설정 온보딩, 권한 자동화, 네트워킹 및 API 관리를 통해 워크로드 실행 시작 시간을 크게 단축합니다. 민감한 워크로드의 시작 시간이 75% 단축되어 서버리스 Spark가 더 넓은 범위의 애플리케이션에 적합하게 되었습니다. 향상된 GPU 가용성은 GPU를 사용할 수 없을 때 요청을 큐에 넣는 Dynamic Workload Scheduler Flex Start Mode를 통해 달성됩니다. 3.0 런타임은 Spark Connect를 포함한 Apache Spark 4.x 혁신에 대한 최상위 지원을 제공하여 분리된 연결을 지원합니다. 향상된 다중 영역 지원은 이제 기본 기능으로, 추가 비용 없이 가용성을 높이기 위해 리전 내 영역에 걸쳐 실행 노드를 분산합니다. Google Cloud는 자동 튜닝 및 자동 확장과 같은 영역에서 사용 편의성을 더욱 향상시키기 위해 지속적으로 혁신하고 있습니다. 사용자는 워크로드에 runtime_version: 3.0을 지정하여 이러한 기능을 활용할 수 있습니다.
CdXz5zHNQW_FXigucFN3T.jpeg

Google Cloud Storage MCP 서버를 사용하여 비정형 데이터를 AI 에이전트와 연결

Google Cloud Storage(GCS)는 에이전트 시스템에서 비정형 데이터에 필수적입니다. 이제 에이전트가 실행 가능한 컨텍스트로 이 데이터를 변환하는 데 중점을 두고 있습니다. GCS의 스마트 스토리지는 수동적인 객체를 강화하여 데이터를 에이전트 준비 상태로 만듭니다. AI의 성공은 의사 결정을 위해 에이전트가 이 인텔리전스에 원활하게 액세스하는 데 달려 있습니다. 이 블로그는 GCS로 구동되는 에이전트의 세 가지 고객 사례를 강조하고 Model Context Protocol(MCP)을 사용하여 에이전트를 안전하게 연결하는 방법을 설명합니다. GCS MCP 서버는 스마트 스토리지 기능과 결합하여 에이전트 배포를 단순화합니다. Palo Alto Networks의 Strata Co-Pilot은 GCS를 기록 메모리로 사용합니다. Airwallex의 AI Assistant는 문서 저장 및 메타데이터를 위해 GCS를 활용합니다. Snap의 Job Optimization Agent는 GCS의 작업 데이터를 분석하여 효율성을 찾습니다. MCP는 보편적인 에이전트-데이터 표준이며, GCS는 원격 및 로컬 MCP 서버 옵션을 제공합니다. 완전 관리형 원격 MCP 서버는 인프라가 필요 없으며 GCS 데이터에 즉시 액세스할 수 있습니다. 주요 에이전트 프레임워크와 통합되며 IAM 및 감사 로그를 통해 강력한 보안을 보장합니다. 선택적으로 Google Cloud Model Armor를 통합하여 고급 위협 보호 기능을 제공할 수 있습니다. 자체 관리형 로컬 MCP 서버는 사용자 정의 도구 및 특수 데이터 변환과 같은 특정 비즈니스 로직을 구축하는 데 이상적입니다. 더 큰 사용자 정의를 위한 오픈 소스 옵션입니다. GCS 로컬 MCP는 이제 MCP Toolbox for Databases의 일부가 되어 개발을 단순화하고 보안을 강화합니다. 사용자는 원격 MCP 서버 또는 로컬 MCP GitHub 리포지토리를 탐색하여 시작할 수 있습니다.
CdXz5zHNQW_PxY9PQk0UJ.gif

Spanner Graph 알고리즘 발표: 연결된 데이터에 대한 Google 수준의 인텔리전스

Google Cloud는 Spanner Graph 알고리즘을 도입하여 사용자가 데이터베이스 내에서 직접 고급 그래프 분석을 실행할 수 있도록 했습니다. 이 기능은 Google Research의 최첨단 그래프 마이닝 기능을 Google Cloud 고객에게 제공합니다. 기업은 이러한 새로운 기능을 활용하여 복잡하게 연결된 데이터에서 더 빠르고 효율적으로 인사이트를 도출할 수 있습니다. 그래프 기술은 사기 탐지, 소셜 네트워크 분석, 의료 연구와 같은 애플리케이션에 점점 더 많이 사용되고 있습니다. 과거에는 대규모로 그래프 알고리즘을 실행하는 것이 어려웠으며, 복잡한 데이터 파이프라인이 필요하거나 트랜잭션 성능에 영향을 미쳤습니다. Spanner Graph 알고리즘은 운영 데이터베이스의 성능을 저하시키지 않고 까다로운 워크로드를 처리하도록 설계되었습니다. GQL과의 긴밀한 통합을 제공하여 표준 쿼리와 함께 알고리즘을 직접 호출할 수 있으며 데이터 이동을 최소화합니다. 알고리즘 실행은 전용 컴퓨팅 리소스에서 이루어져 실시간 프로덕션 트래픽에 거의 영향을 미치지 않습니다. 이 새로운 엔진은 수십억 개의 엣지를 가진 방대한 그래프를 몇 분 안에 처리할 수 있으며, 밀집된 데이터 인코딩을 통해 성능을 최적화합니다. Spanner Graph는 관계형 모델과 그래프 모델을 통합하여 개발자가 ISO GQL을 사용하여 연결된 데이터를 쿼리할 수 있도록 합니다. 새로운 알고리즘은 사기 탐지 또는 제품 추천과 같이 연결된 데이터에서 숨겨진 패턴과 인사이트를 발견하는 데 도움이 됩니다. 주요 알고리즘에는 Centrality, Community Detection, Similarity and Path Finding이 포함됩니다. 사용자는 GQL을 사용하여 이러한 알고리즘을 직접 호출하고 결과를 Spanner Graph 또는 Cloud Storage에 다시 쓸 수 있습니다. 예시는 커뮤니티 탐지와 PageRank를 결합하여 사기 주동자를 식별하는 데 이러한 알고리즘을 어떻게 사용할 수 있는지 보여줍니다. DaVita, Yahoo!, SoundCloud와 같은 업계 선두 기업들은 이미 복잡한 데이터 문제에 Spanner Graph 알고리즘을 활용하고 있습니다.
CdXz5zHNQW_KLmuPh1ZYo.jpeg

데이터 레이크 가속화: gcs-analytics-core를 이용한 Apache Iceberg 및 Spark 최적화

gcs-analytics-core는 Google Cloud Storage를 사용할 때 데이터 엔지니어가 여러 분석 엔진 간의 호환성 및 성능 문제로 겪는 어려움을 해결하기 위한 새로운 오픈 소스 Java 라이브러리입니다. 이 라이브러리는 GCS에서 높은 성능을 보장하면서 분석 엔진 선택에 유연성을 제공합니다. Iceberg Spark와 같은 기존 GCS 분석 엔진에 대한 최적화를 제공하며, 다른 엔진으로 확장할 계획입니다. 이 라이브러리는 GCS에서 분석 워크로드의 성능을 통합하고 향상시키며, 1.11.0 버전부터 Apache Iceberg와 네이티브로 통합됩니다. 분석 엔진과 GCS Java SDK 간의 중앙 집중식 최적화 계층 역할을 하여 Parquet과 같은 열 형식의 읽기 작업을 개선합니다. 주요 기술 최적화에는 병렬 데이터 범위 가져오기를 위한 스레드 벡터 I/O 및 메타데이터를 위한 스마트 Parquet 사전 가져오기가 포함됩니다. 첫 번째 주요 통합은 Apache Iceberg이며, GCSFileIO를 사용하는 엔진은 자동으로 이러한 개선 사항의 이점을 누릴 수 있습니다. 이 라이브러리는 모든 Iceberg 카탈로그와 호환되며 인프라 변경 없이 일관된 읽기 성능 향상을 제공합니다. Spark와 Iceberg를 사용한 TPC-DS 벤치마크는 다양한 데이터셋 크기에 걸쳐 상당한 스캔 시간 및 실행 시간 개선을 보여주었습니다. 시작하려면 Apache Iceberg Spark 런타임 1.11.0 이상, 구성된 GCSFileIO, 그리고 특정 최적화 플래그가 활성화되어 있어야 합니다. 이 라이브러리는 오픈 소스이며 GitHub에 호스팅되어 있으며 커뮤니티 기여 및 피드백을 장려합니다.
CdXz5zHNQW_mMXNFmmBfk.jpeg

TPU, GKE Managed DRANET, 및 Multi-cluster Inference Gateway 실험

이 블로그는 Google Kubernetes Engine에 고가용성 AI 추론 워크로드를 설정하는 방법을 탐구합니다. 목표는 Dynamic Resource Allocation (DRA) 및 Inference Gateway와 같은 기능을 사용하여 한 지역에 장애가 발생하더라도 서비스 액세스를 보장하는 것입니다. 이 실험은 Google Kubernetes Engine (GKE) 관리 DRANET을 사용하여 Pod 간 리소스 공유를 수행하며, 서로 다른 지역의 TPU를 지원합니다. 멀티 클러스터 GKE Inference Gateway는 여러 클러스터에 AI/ML 워크로드를 분산하며, 이는 장애 조치 시나리오에 중요합니다. Cloud Storage FUSE는 모델 및 로그를 위한 중앙 집중식 위치를 제공하여 배포 속도를 높입니다. Virtual Private Cloud (VPC)는 안전한 통신을 보장하며, GKE Fleets는 클러스터 관리를 통합합니다. 이 설정은 고성능 AI 연산을 위해 TPU v6e 가속기를 활용합니다. 설계는 별도의 지역에 있는 두 개의 GKE 클러스터에 대규모 언어 모델을 배포하는 것을 포함하며, 두 클러스터 모두 네 개의 TPU v6e 칩을 사용합니다. 모델은 Cloud Storage에 저장되며, 트래픽은 장애 조치 기능과 함께 전역적으로 라우팅됩니다. 필수 구성 요소에는 VPC 및 서브넷 구성, 방화벽 규칙, 게이트웨이용 고정 IP 예약이 포함됩니다. 클러스터는 Gateway API 및 Cloud Storage FUSE CSI 드라이버가 활성화된 상태로 생성되며, 전용 TPU v6e 노드 풀도 함께 사용됩니다. 관리형 DRANET은 가속화된 네트워킹을 위해 이러한 노드 풀에서 활성화됩니다. 클러스터는 통합 관리를 위해 GKE Fleet에 등록되어 멀티 클러스터 서비스 검색 및 인그레스를 가능하게 합니다. AI 워크로드는 모델 가중치를 Cloud Storage에 다운로드하고 TPU 액세스를 위해 DRANET을 활용하는 추론 서버를 배포하는 것을 포함합니다. 멀티 클러스터 Inference Gateway는 사용자 정의 리소스 정의, 자동 확장 메트릭 및 통합 배포를 위한 InferencePool로 구성됩니다. 마지막으로, 게이트웨이는 가장 사용 가능한 지역으로 트래픽을 라우팅하도록 구성되며, 테스트는 시뮬레이션된 중단 중에 보조 클러스터로의 원활한 장애 조치를 확인합니다.
CdXz5zHNQW_UvLTnPEClj.png

Trustpilot이 Gemma를 사용하여 실시간 데이터 보강을 위한 아키텍처를 구축한 방법

Trustpilot은 매일 수백만 건의 사용자 리뷰를 처리하며, 이는 엄격한 지연 시간 및 비용 제약이 따르는 복잡한 작업입니다. Trustpilot은 Google과 협력하여 미세 조정된 Gemma 모델을 사용하여 대규모 스트리밍 파이프라인을 구축함으로써 핵심 AI 전략을 생성형 AI로 전환하고 있습니다. 이 전환을 통해 Trustpilot은 명명된 개체 인식, 분류, 감성 점수 산정, 의도 파악과 같은 작업을 수행하여 리뷰에서 심층적이고 실행 가능한 인사이트를 추출할 수 있습니다. Gemma와 같은 오픈 가중치 모델을 미세 조정하는 것을 선택함으로써 Trustpilot은 완전한 모델 독립성, 예측 가능한 경제성 및 확장된 MLOps 기능을 확보했습니다. Trustpilot은 경량 google/gemma-2-9b를 기반으로 특화된 모델 제품군을 구축했습니다. 고품질 학습 데이터셋은 Gemini 교사 모델과 계층화된 리뷰 샘플에 대한 합의 주석을 사용하여 생성되었습니다. 이러한 데이터셋을 통해 기존 솔루션을 능가하고 교사 모델 정확도에 근접하는 맞춤형 모델을 미세 조정할 수 있었습니다. 시스템 아키텍처는 Dataflow와 Gemini Enterprise Agent Platform Endpoints를 활용하여 비즈니스 로직을 원시 LLM 추론과 분리하여 확장성을 확보했습니다. 성능 튜닝은 A100 GPU가 장착된 A2 VM에서 vLLM을 최적화하고 고스트리밍 볼륨을 위해 vLLM 백엔드를 구성하는 데 중점을 두었습니다. 과제로는 개인 네트워킹 제한, 배포 관찰 가능성, EU 지역의 GPU 부족 등이 있었습니다. 궁극적으로 Trustpilot은 Gemini와 유사한 성능을 훨씬 저렴한 비용으로 달성하여 수백만 건의 리뷰를 즉각적이고 실행 가능한 인사이트로 전환했습니다.
CdXz5zHNQW_BiOLPvCRmR.png

BigQuery Graph를 이용한 식품 공급망의 디지털 트윈 모델링

레스토랑 체인을 성장시키는 것은 전통적인 스프레드시트로는 효과적으로 해결할 수 없는 고유한 과제를 제시합니다. 이러한 과제에는 공급망의 스퀴즈 효과, SOP 드리프트로 인한 브랜드 일관성 저하, 식품 안전 문제의 광범위한 영향, 무단 지출로 인한 재정적 손실 등이 포함됩니다. 이러한 복잡성을 관리하기 위해 디지털 트윈으로 알려진 비즈니스의 디지털 복제가 필수적입니다. 관계형 데이터베이스가 표준이었지만, 대규모 운영에서는 종속성 추적의 한계가 분명해집니다. BigQuery Graph는 사용자가 기존 데이터 플랫폼 내에서 공급망의 디지털 트윈을 구축할 수 있도록 함으로써 해결책을 제공합니다. 이는 항목 및 위치와 같은 물리적 개체를 노드와 엣지의 네트워크로 모델링하여 달성됩니다. 시스템은 기존 테이블에 대한 그래프 뷰를 생성하여 관계를 설명함으로써 의미론적 계층을 정의합니다. 이 접근 방식은 운영을 반응적 문제 해결에서 사전 예방적 정밀도로 전환하여 수술적 리콜 및 상세한 위험 분석을 가능하게 합니다. 그래프 쿼리는 복잡한 데이터 분석을 단순화하여 관계를 추적하고 통찰력을 신속하게 수집하는 것을 더 쉽게 만듭니다. 최적의 결과를 위해 그래프로 관계를 구조화하고, 깨끗한 키를 통해 데이터 무결성을 보장하며, 그래프의 엣지에 메타데이터를 캡처하는 데 집중하십시오. 궁극적으로 BigQuery Graph는 비즈니스가 데이터를 단순한 목록으로 관리하는 것을 넘어 몇 초 안에 중요한 도메인 간 관계를 시각화할 수 있도록 합니다.
CdXz5zHNQW_scvEnWRnwp.png

AlloyDB용 완전 관리형 원격 MCP 서버가 이제 정식 출시되었습니다.

AI 에이전트는 안정적으로 작동하기 위해 고품질의 접근 가능한 컨텍스트를 필요로 하며, 이는 종종 운영 데이터베이스에서 발견됩니다. 이를 해결하기 위해 Google Cloud는 AlloyDB용 Remote Model Context Protocol (MCP) Server를 출시했으며, 이는 현재 일반적으로 사용 가능합니다. MCP는 LLM이 외부 데이터 소스에 안전하게 연결할 수 있도록 하는 오픈 소스 표준입니다. 이 통합을 통해 AI 에이전트는 AlloyDB에서 실시간 엔터프라이즈 데이터에 액세스하여 오래된 정보로 인한 부정확성을 방지할 수 있습니다. AlloyDB는 뛰어난 벡터 성능, 고급 검색 기능, 내장 AI 함수를 통한 실시간 인텔리전스를 통해 에이전트 애플리케이션을 위한 강력한 기반을 제공합니다. AlloyDB, BigQuery 및 Iceberg 테이블의 데이터를 원활하게 조인할 수 있도록 하여 통합 데이터 액세스를 제공합니다. AlloyDB용 Remote MCP Server는 관리형 Google Cloud 인프라에서 실행되어 프로덕션 워크로드에 대한 연결을 단순화합니다. 중앙 집중식 검색, 완전 관리형 HTTP 엔드포인트, 향상된 보안을 위한 Google Cloud IAM을 사용한 세분화된 권한 부여 기능을 제공합니다. AlloyDB 툴셋은 운영 인스턴스 관리 및 데이터 유출 방지를 위한 Model Armor 보호 기능을 통해 에이전트에게 권한을 부여합니다. 감사 로깅은 모든 에이전트 작업에 대한 완전한 추적을 제공합니다. 시작하려면 API 준비, 데이터베이스 프로비저닝 및 원격 엔드포인트와 IAM 자격 증명을 사용한 에이전트 구성이 필요합니다. 이를 통해 에이전트는 데이터베이스 스키마를 이해하고 복잡한 쿼리를 실행하여 안정적이고 근거 있는 답변을 제공하고 엔터프라이즈 에이전트 애플리케이션을 향상시킬 수 있습니다.
CdXz5zHNQW_ZmZ1bXr5CP.gif

GKE 스탠바이 버퍼 소개: 예산을 초과하지 않고 노드 시작 시간 개선

Google Kubernetes Engine는 애플리케이션 성능과 비용 간의 상충 관계를 해결하기 위해 standby buffers라는 새로운 기능을 도입했습니다. 이전에는 과잉 프로비저닝이 빠른 시작을 보장했지만 비용이 많이 들었고, 비용을 최소화하면 느린 콜드 스타트가 발생했습니다. GKE standby buffers는 클러스터를 위한 저비용의 일시 중지된 용량 버퍼를 제공합니다. 이 기능은 거의 제로에 가까운 시작 지연 시간으로 트래픽 급증을 처리하기 위해 즉시 사용 가능한 용량을 제공하는 GKE active buffers를 기반으로 합니다. Standby buffers는 일반적으로 한 자릿수 낮은 백분율의 최소 비용만 발생하는 일시 중지된 용량을 유지합니다. standby buffers가 없는 클러스터와 비교했을 때, 이를 활용한 클러스터는 동일한 트래픽 부하에서 훨씬 낮은 지연 시간을 경험했습니다. standby buffers가 있는 클러스터는 P50 지연 시간을 한 자릿수 초 단위로 유지했으며, P95 및 P99 메트릭은 잠시 동안 1분까지 치솟았습니다. 기존 Kubernetes 자동 확장은 느리며 HPA 임계값을 낮추거나 balloon pod를 관리하는 것과 같은 해결책이 필요합니다. 이러한 해결책은 종종 비용이 많이 들고 운영상 복잡합니다. GKE active 및 standby buffers는 수동 구성의 필요성을 제거하는 선언적 용량 관리 접근 방식을 제공합니다. Standby buffers는 컴퓨팅 용량을 일시 중지하고 영구 디스크 및 IP 주소 비용만 발생시켜 인프라 비용을 절감합니다. Active buffers와 결합하면 과잉 프로비저닝과 유사한 성능으로 거의 즉각적인 pod 예약을 가능하게 하지만 훨씬 저렴한 가격으로 제공됩니다. 시스템은 standby buffer에서 active buffer를 다시 채우는 것을 우선시하며, 이는 장기간의 부하를 처리하고 느린 노드 콜드 스타트로부터 보호합니다. Standby buffers는 새 노드를 생성하는 것보다 2-3배 빠르게 재개되어 콜드 스타트와 항상 켜져 있는 용량 간의 격차를 효과적으로 해소합니다. 이 기능을 통해 기업은 다양한 워크로드에 대해 성능과 비용을 동적으로 균형 맞출 수 있습니다.
CdXz5zHNQW_8oX6vyeOVS.png

클라우드 CISO 관점: 공공 부문을 위한 AI 준비 보안 프로그램 구축 방법

이 Cloud CISO Perspectives는 정부 및 중요 인프라를 위한 AI 준비 보안 프로그램 구축에 중점을 둡니다. Usman Chaudhary의 이 글은 CISOs를 위한 로드맵을 제공하며 실행 가능한 단계를 강조합니다. 접근 방식의 핵심은 맞춤형 워크플로우 구축, 상용 AI 통합, 그리고 이를 기존 보안에 통합하는 것입니다. 권장 계획에는 90일 집중 기간과 함께 6개월 내 전술적 목표, 6~12개월 내 전략적 목표가 포함됩니다. 이러한 이니셔티브는 효율적인 자원 할당과 즉각적인 성과 달성을 위해 5가지 CISO 워크로드 도메인에 걸쳐 구성됩니다. 즉각적인 조치에는 비즈니스 정당화를 위한 경영진 협력, 컨텍스트 수집 자동화, 공급업체 최적화가 포함됩니다. 위협 인텔리전스, SOP 통합, 인재 개발은 6개월 내 핵심 사항입니다. 6~12개월 내 전략적 목표에는 포지션 향상, 고급 거버넌스, 사고 대응 구현이 포함됩니다. Gemini for Government 사용을 포함하여 취약점 우선순위 지정, 위협 헌팅, 자동화된 사고 대응을 위해 AI를 활용하는 능동적 방어에 중점을 둡니다.
CdXz5zHNQW_CtIrww9vHh.jpeg

Gemini 엔터프라이즈와 A2UI 통합 개발자 가이드

이 텍스트는 채팅 애플리케이션 내에서 풍부하고 상호작용적인 사용자 인터페이스를 만들기 위한 오픈 프로토콜인 A2UI를 소개합니다. 주로 텍스트를 사용하는 챗봇의 한계를 다루며, 이는 비효율적인 다중 턴 대화로 이어집니다. A2UI는 에이전트가 JSON 페이로드로 설명된 UI 구성 요소를 반환할 수 있도록 하여 사용자 경험을 향상시킵니다. 이 프로토콜은 선언적이며, 스트리밍 친화적이고, 프레임워크에 구애받지 않습니다. 파이프라인을 통해 전달되는 데이터 형식 또는 "화물"을 정의하는 A2UI를 사용하여 4계층 스택을 활용하여 작동합니다. Gemini Enterprise(GE)에 내장된 A2UI 렌더러가 있기 때문에 Gemini Enterprise(GE)와의 통합이 단순화됩니다. 개발자는 도구와 함께 A2UI 구성 요소를 포함하는 A2A 에이전트를 구축합니다. 그런 다음 이러한 A2A 에이전트는 GE에 엔드포인트로 등록됩니다. 사용자가 A2UI 위젯과 상호작용하면 GE는 상호작용을 입력으로 에이전트에게 다시 보냅니다. 참조 구현은 원활한 GE 통합을 위해 ADK 백엔드를 사용합니다. 에이전트는 GoogleMap과 같은 구성 요소에 Google Maps Embed iframe을 사용합니다. 개발 프로세스에는 참조 리포지토리를 복제하고 GE를 구성하는 것이 포함됩니다. A2UI를 사용하면 챗봇이 날짜 선택기와 같은 대화형 요소를 활용하여 보다 원활한 사용자 경험을 제공할 수 있습니다.
CdXz5zHNQW_EnvqazX08Y.jpeg

페타바이트에서 예측까지: Google 스프레드시트에서 간편하게 BigQuery 인사이트 얻기

조직은 종종 주요 데이터 소스로 BigQuery를 사용하지만, 임시 분석은 Google Sheets에서 자주 수행됩니다. 이러한 플랫폼 간의 데이터 전송은 일반적으로 CSV 내보내기와 같은 비효율적인 방법을 포함하여 데이터 사일로 및 보안 문제를 야기합니다. Connected Sheets는 BigQuery와 Google Sheets 간의 직접적이고 실시간 연결을 제공하여 이를 해결합니다. 이를 통해 사용자는 SQL 지식 없이도 익숙한 스프레드시트 인터페이스 내에서 대규모 데이터 세트를 분석할 수 있습니다. 데이터 관리자는 액세스를 제어하고 보안을 유지할 수 있으며, 사용자는 피벗 테이블 및 차트와 같은 기능을 통해 민첩성과 사용 편의성을 얻을 수 있습니다. Connected Sheets는 셀프 서비스 분석, 운영 보고 및 하이브리드 데이터 모델링을 촉진하여 다양한 비즈니스 기능의 사용자를 지원합니다. 비즈니스 분석가는 BigQuery의 실시간 데이터를 활용하여 맞춤형 보고서 및 대시보드를 구축할 수 있습니다. 설정은 간단하며, Google Workspace 계정과 결제가 사용 설정된 Google Cloud 프로젝트만 있으면 Google Sheets 또는 BigQuery 콘솔에서 액세스할 수 있습니다. Connected Sheets의 목표는 사용자가 클라우드의 확장성과 스프레드시트의 유연성을 활용할 수 있도록 지원하는 것입니다. 이를 통해 대규모 데이터 세트에 액세스하고 작업하는 것이 더 쉽고 효율적이 되며, 궁극적으로 데이터가 필요한 사람들의 손에 직접 데이터를 전달합니다.
CdXz5zHNQW_MrmvTOsjbj.gif

AlloyDB 핫 스탠바이: 더 빠른 장애 조치, 일관된 성능

AlloyDB for PostgreSQL은 까다로운 엔터프라이즈 요구 사항을 위해 설계된 PostgreSQL과 호환되는 완전 관리형 데이터베이스 서비스입니다. Google 인프라와 원활하게 통합되어 탁월한 성능, 확장성 및 가용성을 제공합니다. 핵심 고가용성(HA) 아키텍처는 서로 다른 영역 내의 활성 노드와 대기 노드를 포함합니다. 전통적으로 대기 노드는 유휴 상태였으며, 데이터베이스 재시작 및 캐시 워밍으로 인한 장애 조치 중 잠재적인 지연을 초래했습니다. AlloyDB는 Hot Standby를 도입하여 대기 노드의 역할을 변경하여 쓰기 전 로그를 지속적으로 처리합니다. 대기 노드가 이미 실행 중이므로 장애 조치 시간이 크게 단축됩니다. Hot Standby는 또한 장애 조치 후 일관된 성능을 보장하며 최적의 속도를 위해 메모리 캐시를 따뜻하게 유지합니다. 이러한 향상된 가용성과 복원력은 AlloyDB 사용자에게 추가 비용 없이 제공됩니다. 시연은 Hot Standby를 통한 더 빠른 장애 조치와 즉각적인 성능 재개를 강조합니다. 이 업그레이드는 처음에 PostgreSQL 18에서 사용할 수 있으며 곧 이전 버전에도 출시될 예정입니다. AlloyDB의 99.99% SLA는 고가용성의 이러한 발전을 통해 더욱 향상됩니다. Hot Standby는 뛰어난 PostgreSQL 경험을 제공하는 데 있어 중요한 단계입니다.
CdXz5zHNQW_wdPYMX29IR.png

나노 바나나 2와 나노 바나나 프로는 현재 구매 가능하며, 이미 창의적인 워크플로우에 활용되고 있습니다.

조직들은 차세대 경험을 위해 AI를 크리에이티브 워크플로우에 통합하고 있습니다. 새로운 엔터프라이즈급 AI 모델인 Nano Banana 2와 Nano Banana Pro가 Gemini Enterprise Agent Platform을 통해 현재 일반에 공개되었습니다. 이 모델들은 강력한 인프라와 보안을 기반으로 애플리케이션 및 워크플로우 내에서 고품질 이미지 생성 및 편집을 가능하게 합니다. 새로운 미리보기 기능은 Nano Banana 2가 비디오 파일을 입력 프롬프트로 처리할 수 있도록 하여 멀티모달 기능을 확장합니다. 고객들은 이러한 모델을 활용하여 다양한 산업에서 혁신을 이루고 있습니다. 마케팅 및 크리에이티브 분야에서는 Adobe 및 WPP와 같은 기업들이 맞춤형 캠페인을 확장하고 브랜드 참여를 강화하고 있습니다. Shopify 및 URBN과 같은 리테일러들은 몰입형 쇼핑 경험과 가속화된 제품 개발을 위해 이러한 기능을 활용하고 있습니다. 미디어 및 엔터테인먼트 기업들은 감독의 통제를 보장하며 차세대 제작 워크플로우를 구축하고 있습니다. Google Cloud는 엔터프라이즈 규모의 멀티모달 경험을 구축하기 위한 모델과 도구를 제공합니다. 개발자들은 Gemini API를 통해 이러한 모델에 액세스할 수 있으며, Enterprise Agent Platform의 경우 엔터프라이즈 SLA를 이용할 수 있습니다.
CdXz5zHNQW_1nWvaoQ9CP.png

머신러닝을 위한 대규모 데이터셋 처리를 위한 데이터플로우의 진화

Google의 데이터 플랫폼인 Flume은 AI 시대의 방대한 데이터 처리 요구를 해결하기 위해 MapReduce에서 발전했습니다. 현재 Google Cloud의 Dataflow에서 사용할 수 있는 Flume의 혁신은 확장성, 효율성 및 개발자 경험에 중점을 둡니다. 엄청난 규모를 처리하기 위해 Dataflow는 동적 작업 단위 재조정을 위한 liquid sharding과 Google의 인프라 전반에 걸친 스케줄링을 위한 global compute를 특징으로 합니다. 자동 파이프라인 최적화는 연산을 융합하여 오버헤드를 줄이고, 외부 API 호출 속도 제한은 시스템 과부하를 방지합니다. Tandem pools는 서버리스 원격 추론을 가능하게 하여 확장성 제한을 극복합니다. 효율성을 위해 Dataflow는 이기종 워커 풀을 제공하여 워크로드를 TPU와 같은 적절한 가속기와 일치시킵니다. TPU 인식 자동 확장 및 duty-cycle 정책 시행은 TPU 활용도를 최적화하여 비용을 절감합니다. TPU fungibility는 작업을 가장 적합한 TPU 버전 및 위치에 스케줄링하도록 보장합니다. 개발자 경험은 여러 프로그래밍 언어와 SQL을 지원하는 다목적 SDK를 통한 언어 유연성으로 향상됩니다. JAX와 같은 ML 프레임워크와의 통합 및 LLM 최적화를 위한 네이티브 지원이 제공됩니다. 통합 배치 및 스트리밍 처리를 통해 사용자는 과거 데이터와 실시간 데이터 모두에 대해 동일한 코드를 사용할 수 있습니다. 모니터링 UI를 통한 관찰 가능성은 프로덕션 파이프라인에 대한 포괄적인 제어 및 진단 데이터를 제공합니다. 샘플링, dry-run, 파이프라인 일시 중지/재개와 같은 고급 워크플로는 개발 및 운영을 가속화합니다. Dataflow는 이러한 Google 내부 혁신을 Google Cloud 고객에게 제공하여 까다로운 ML 애플리케이션을 해결할 수 있도록 합니다.

SRE에서의 AI: Google이 운영 개선을 위해 에이전트 AI를 어디에 어떻게 배포하고 있는가

Google의 SRE 팀은 AI 발전으로 인한 시스템 복잡성 증가에 따라 AI를 통합하도록 진화하고 있습니다. 이 "SRE AI" 이니셔티브는 AI를 활용하여 소프트웨어 개발 수명 주기를 향상시키는 것을 목표로 합니다. AI 통합 기회는 신뢰성 설계 및 사고 관리 등 다양한 단계에 걸쳐 있습니다. AI 기반 이상 탐지 및 경고는 응답 시간을 개선하고 경고 피로를 줄이기 위해 구현되고 있습니다. AI 에이전트는 사고 조사, 커뮤니케이션 및 사후 분석 프로세스를 간소화하기 위해 개발되고 있습니다. SRE 팀은 과거 사고를 분석하고 위험 관리를 개선하기 위해 AI Insights를 구축하고 있습니다. 주요 설계 원칙은 AI 에이전트 운영에서 투명성, 보안 및 신뢰성을 우선시합니다. Google SRE AI는 Gemini 및 Agent Development Kit를 포함한 Google의 기존 인프라를 활용합니다. 자율 수준 추적은 시스템의 실제 자율성을 평가하는 데 도움이 됩니다. 궁극적인 목표는 서비스 신뢰성을 개선하고 운영 비용을 절감하며 엔지니어에게 권한을 부여하는 것입니다. 백서에는 Google의 SRE AI 접근 방식에 대한 더 자세한 정보가 제공됩니다.
CdXz5zHNQW_0GUKjXPWQS.png

Google Cloud에서 리소스 수준에서 비즈니스 수준으로 유지보수 전환

성장하는 클라우드 환경에서 계획된 유지보수를 관리하는 것은 복잡하고 파편화될 수 있습니다. 현재 업데이트를 추적하려면 지원하는 비즈니스 서비스에 인프라 리소스를 수동으로 연결해야 하는 경우가 많습니다. Google Cloud는 이 프로세스를 단순화하기 위해 Unified Maintenance 내에서 앱 중심 유지보수 가시성을 출시합니다. 이 새로운 기능은 개별 리소스에서 유지보수에 대한 비즈니스 지향적인 보기로 초점을 전환합니다. App Hub와 통합되어 사용자가 애플리케이션의 맥락에서 유지보수 이벤트를 볼 수 있습니다. 이제 "애플리케이션"이 유지보수 관리를 위한 기본 단위가 됩니다. GKE 클러스터 또는 GCE VM과 같이 App Hub에 등록된 리소스는 유지보수 일정이 단일 대시보드에 집계됩니다. 이를 통해 플랫폼 엔지니어는 알림을 소유자에게 매핑할 필요가 없어 수동 노력을 줄일 수 있습니다. 또한 성능 문제를 인프라 업데이트와 연관시켜 문제 해결을 더 빠르게 할 수 있습니다. 목표는 모든 서비스에 걸쳐 유지보수 영향에 대한 비즈니스 중심의 이해를 바탕으로 예측 가능한 운영을 제공하는 것입니다. Google Cloud에 기존 애플리케이션이 있는 사용자는 Cloud Console에서 이러한 기능에 액세스하고 설정을 위한 가이드를 참조할 수 있습니다.
CdXz5zHNQW_Oyi9ZwouA7.png

중앙 오클라호마 대학교(University of Central Oklahoma)가 복잡한 형사 사건 분석을 간소화하기 위해 AI를 활용하는 방법

중앙 오클라호마 대학교(University of Central Oklahoma)의 법의학 과학 연구소(Forensic Science Institute, FSI)는 Google과 협력하여 범죄 사건 분석을 가속화하는 것을 목표로 하는 AI 솔루션을 개발했습니다. 이 협력은 Google의 NotebookLM을 활용하여 복잡한 문서를 분석하고 타임라인을 구성하는 데 필요한 시간을 크게 단축합니다. 이 프로젝트는 UCO의 CIO인 Sonya Watkins가 주도한 AI 해커톤에서 시작되었으며, 영향력 있는 AI 솔루션을 식별하는 데 중점을 두었습니다. 해커톤에서는 아이디어 생성 및 영향 평가를 위해 Gemini를 사용하는 사건 타임라인 분석 도구를 우선시했습니다. 초기 시험 결과, 사건 분석에 소요되는 수개월의 부담이 상당히 줄어들었습니다. FSI 강사를 포함한 UCO 팀은 AI 생성 타임라인이 법의학 표준을 충족하도록 세심하게 보장하고 있습니다. 그들은 AI 결론이 원본 문서에 직접 연결되도록 하는 반복 가능한 프레임워크를 개발하고 있습니다. 이 프레임워크는 전국적인 채택을 목표로 하며, 법의학 연구소 및 법 집행 기관의 증거 처리 표준을 정립합니다. 이 프로젝트의 목표는 전국적으로 정의 구현을 지원하는 확장 가능한 솔루션을 만드는 것입니다. Google은 유사한 AI 기반 연구 기능을 기관에 제공하기 위해 Gemini for Education을 제공하고 있습니다.

Google for Startups Accelerator: Middle East, North Africa & Turkey의 최신 코호트 발표

Google은 전 세계 정보를 체계화하고 AI 기반 스타트업, 특히 MENA-T 지역의 스타트업을 지원하는 것을 목표로 합니다. Google for Startups Accelerator 프로그램은 이 지역의 혁신을 육성합니다. 15개 기업으로 구성된 새로운 기수가 6월 1일에 프로그램을 시작합니다. 이 스타트업들은 멘토링, 기술 지원 및 지역적 복잡성을 헤쳐나갈 수 있는 리소스를 활용하게 됩니다. 2025년 11월에 종료된 이전 기수는 Google 전문가의 지도하에 중요한 성과를 달성했습니다. 이러한 성과에는 비즈니스 전략 개선 및 AI/ML 이니셔티브 가속화가 포함되었습니다. 2026년 프로그램은 어려운 지정학적 상황에 대한 추가적인 초점을 제공합니다. 선정된 기업들은 의료, 전자상거래, 교육 등 다양한 분야에서 AI를 활용합니다. 3개월 과정은 보안 및 생성 디자인 교육을 포함한 기술 전문 지식을 제공합니다. 이 프로그램은 스타트업이 혁신을 확장할 수 있도록 전략적 비즈니스 모델링을 통합합니다. COGNNA는 프로그램 개선 후 상당한 펀딩 라운드를 성사시키며 상당한 성장을 보였습니다. Smart Bricks 또한 펀딩을 확보하고 Google의 AI 도구를 사용하여 부동산 투자 자동화를 진행했습니다. Google은 지역 창업가들을 지원하고 지속적인 디지털 성장과 혁신을 위한 인프라를 제공하는 데 전념하고 있습니다.
CdXz5zHNQW_c6CNjEp6Al.jpeg

Cloud Run에서의 AI 콜드 스타트 가이드

이 텍스트는 Cloud Run에서 AI 모델의 긴 콜드 스타트 시간 문제를 탐구하며, 이는 개발자들을 좌절시키고 일부는 서버리스 GPU를 피하게 만듭니다. AI 콜드 스타트의 네 가지 단계, 즉 인프라 프로비저닝, 컨테이너 이미지 스트리밍, 엔진 초기화, 모델 로딩을 상세히 설명합니다. 저자는 이러한 콜드 스타트를 개선하기 위해 Google Cloud 문서에서 발췌한 모범 사례를 제공합니다. 주요 최적화 전략에는 모델 형식 및 크기 최적화, 효율적인 스토리지 옵션 선택, 시작 CPU 부스트 사용, Direct VPC Egress 구성이 포함됩니다. 저자는 GPU 활용도를 극대화하고 불필요한 스케일 아웃을 방지하기 위해 동시성 튜닝을 강조합니다. 추가 전략으로는 전역 배포를 위한 단일 리전 "항시 실행" 서비스 또는 콜드 스타트를 숨기기 위한 "깨우기 호출" 사용을 제안합니다. 또한 시작 프로브 조정의 중요성을 강조하고 Elastic의 접근 방식에서 여러 서비스 변형을 관리하는 예시를 제공합니다. 이러한 전략은 인프라를 문제에서 확장 가능하고 안정적인 AI 솔루션으로 전환하는 것을 목표로 합니다. 핵심은 콜드 스타트 최적화가 AI를 취미 프로젝트에서 프로덕션 준비 배포로 전환하는 데 필수적이라는 것입니다.
CdXz5zHNQW_kcXbDOy26t.jpeg

Google AI 위협 방어를 소개합니다. 적보다 앞서 나갈 수 있도록 도와드립니다.

AI의 부상으로 인해 사이버 위협이 빠르게 진화하고 있으며, 이에 따라 조직은 방어 체계를 조정해야 합니다. Google은 이러한 진화하는 위협에 맞서기 위해 AI Threat Defense를 출시합니다. Google의 보안 전문성을 기반으로 구축된 이 시스템은 AI를 활용하여 위협 탐지 및 대응을 자동화합니다. 이 플랫폼은 Mandiant와 Wiz를 Gemini의 기능과 통합하여 포괄적인 보안을 제공합니다. AI Threat Defense는 취약점 준비, 스캔 및 우선순위 지정, 복구, 모니터링에 중점을 둡니다. 핵심 기능에는 자동화된 취약점 식별, 복구 및 지속적인 모니터링이 포함됩니다. 이 시스템은 AI 에이전트를 사용하여 공격 경로를 적극적으로 예측하고 위협의 우선순위를 지정하여 패치를 더 빠르게 적용합니다. CodeMender를 통합함으로써 이 플랫폼은 자동화된 패치 생성 및 테스트를 제공하여 복구를 가속화합니다. 이는 복구 시간을 크게 단축하고 전반적인 보안 태세를 개선하는 것을 목표로 합니다.
CdXz5zHNQW_5WZTzAxzf8.gif

AI 시대를 위한 Google의 글로벌 및 데이터 센터 네트워크 진화 방식

Google의 네트워크는 기술 시대마다 상당한 발전을 거듭해 왔으며, 이제 AI의 요구에 직면해 있습니다. AI 시대는 개별 데이터 센터의 능력을 초월하는 막대한 컴퓨팅 성능과 특화된 네트워킹을 요구합니다. Google은 지속 가능한 에너지를 갖춘 데이터 센터를 전략적으로 배치하고 네트워크를 활용하여 하이퍼컴퓨팅 리소스를 구축합니다. 이는 칩부터 애플리케이션까지 수직적으로 통합된 AI 스택을 필요로 하며, AI 하이퍼컴퓨터가 이를 뒷받침합니다. 네트워크의 핵심 요소에는 내부 패브릭, 사이트 간 연결, 글로벌 네트워크가 포함됩니다. AI 하이퍼컴퓨터 내에서 Virgo Network는 AI 워크로드를 위한 막대한 대역폭, 낮은 지연 시간, 복원력을 제공합니다. 자율적인 안정성 기능과 고해상도 텔레메트리는 네트워크 운영을 향상시키고 패브릭 내 다운타임을 최소화합니다. 캠퍼스 전반에 걸쳐 AI 워크로드를 확장하려면 멀티 샤드 네트워크 및 AI 네이티브 Cloud Interconnect를 포함한 WAN 최적화가 필요합니다. 글로벌 네트워크는 광범위한 인프라를 통해 낮은 지연 시간과 높은 가용성을 제공하며 AI 추론을 지원합니다. 이러한 네트워크 혁신은 Google Cloud 환경에 직접 통합되어 사용자에게 AI 워크로드를 지원합니다.
CdXz5zHNQW_t9FVgUkNUQ.jpeg

새로운 연구: 브라우저 내 AI 보안이 IT 리더들에게 최우선 과제

생성형 AI는 직장에서 일반적인 도구가 되어 IT 리더들에게 새로운 보안 과제를 제시하고 있습니다. 브라우저는 이제 주요 작업 공간이 되었으며, 강화된 보안 조치가 필요합니다. 최근 Omdia 보고서는 IT 전문가들을 대상으로 설문 조사한 결과, 대부분의 조직에서 브라우저 보안이 최우선 과제임을 밝혔습니다. 생성형 AI 사용은 널리 퍼져 있으며, 대부분의 조직은 직원들이 공개 애플리케이션을 사용하도록 허용하고 있습니다. 이는 데이터 유출에 대한 새로운 위험을 초래하며 AI 보안의 중요성을 강조합니다. AI 기반 피싱 및 데이터 유출을 포함한 브라우저 기반 위협은 IT 전문가들에게 주요 관심사입니다. 생성형 AI 애플리케이션 보안은 새로운 보안 솔루션을 평가할 때 중요한 사용 사례입니다. 기존의 네트워크 기반 보안 도구는 이러한 변화하는 환경에서 종종 불충분합니다. Chrome Enterprise는 AI 보안을 브라우저에 직접 통합하여 솔루션을 제공합니다. 이를 통해 조직은 AI 사용을 발견하고 관리하며, 데이터 보호 제어를 시행하고, 상황 인식 액세스 정책을 설정할 수 있습니다. 현대의 AI 기반 작업장에서 조직을 보호하기 위해 브라우저 보안이 이제 중요해졌습니다.
CdXz5zHNQW_EXfLNFtWW0.png

ViewState 역직렬화 취약점을 통한 지식 탈취

2025년 말, Mandiant는 인증되지 않은 RCE라는 치명적인 취약점으로 인해 KnowledgeDeliver LMS 침해 사고를 조사했습니다. 이 취약점은 모든 배포판에 걸쳐 동일한 사전 공유 ASP.NET 머신 키에서 비롯되었습니다. 공격자들은 이를 악용하여 웹사이트를 통해 사용자를 감염시키려는 목적으로 악성 코드를 주입했습니다. 키가 동일했기 때문에 하나의 인스턴스를 침해하면 모든 인스턴스를 침해할 수 있었습니다. 공격자들은 접근 권한을 유지하기 위해 BLUEBEAM이라는 .NET 기반 인메모리 웹 쉘을 배포했습니다. 그들은 가짜 보안 경고를 표시하고 원격 스크립트를 로드하기 위해 JavaScript를 포함한 파일을 수정했습니다. 이로 인해 사용자 워크스테이션에 Cobalt Strike BEACON 감염이 발생했습니다. 이러한 공격을 탐지하기 위해 조직은 애플리케이션 이벤트 로그(이벤트 ID 1316), w3wp.exe의 의심스러운 프로세스 활동 및 파일 무결성을 모니터링해야 합니다. 비정상적인 사용자 에이전트 문자열에 대한 모니터링도 중요합니다. 복구에는 머신 키를 교체하고 LMS에 대한 접근을 제한하는 것이 포함됩니다. 이 사건은 배포 템플릿에서 공유 비밀의 위험을 강조합니다.

2 PhaaS 2 Furious: 중국어 피싱 서비스의 진화

중국어 피싱 서비스(PhaaS)가 빠르게 성장하며 성숙한 서비스와 광범위한 범죄 생태계와의 복잡한 연계를 제공하고 있습니다. 이러한 플랫폼은 사이버 범죄자들의 진입 장벽을 낮추어 사회 공학 및 자격 증명 탈취를 가능하게 합니다. 이 생태계는 비밀번호 수집에서 MFA를 우회하기 위한 OTP 실시간 가로채기로 이동하고 있습니다. 공격자들은 디지털 지갑을 악용하여 탈취된 데이터를 토큰화된 자산으로 전환하여 무단 금융 통제를 수행합니다. 러시아의 유사 서비스와 달리 중국어 PhaaS는 종종 일반 대중을 대상으로 하며 공개적으로 운영됩니다. 이러한 서비스는 개인 식별 정보(PII) 판매, 호스팅, 자금 세탁을 포함한 광범위한 부가 서비스를 제공합니다. 공격은 RCS 및 iMessage를 사용하여 암호화된 전달을 수행하고 관리자 패널을 통해 실시간으로 가로챕니다. AI는 피싱 페이지 생성을 자동화하는 데 사용되어 탐지를 어렵게 만듭니다. 이러한 플랫폼은 다양한 국제 시장을 위한 현지화된 콘텐츠를 생성하는 현지화 서비스(localization-as-a-service)를 지원합니다. 사례 연구인 YY Lai Yu는 정교한 타겟팅과 봇 방지 조치를 통해 일본에 초점을 맞췄습니다. 이러한 플랫폼의 지속적인 발전은 FIDO2/WebAuthn과 같은 사용자 교육을 넘어선 기술적 보안 통제의 필요성을 강조합니다.
CdXz5zHNQW_Hrw87qeaFv.png

청사진: Movix가 전문 에이전트 AI로 치과 기술의 격차를 메우는 방법

Movix는 숙련된 기술자의 수요 증가와 부족 현상에 대처하기 위해 치과 보조기 제조업체를 위한 AI 기반 솔루션을 개발하고 있습니다. 이 회사는 품질 관리를 개선하고 프로세스를 간소화하여 얼라이너 제조에서 발생하는 비용이 많이 드는 오류를 줄이기 위한 에이전트 워크플로우를 만드는 데 중점을 둡니다. 그들의 솔루션은 3D 스캔의 결함 감지와 같은 작업을 위해 Google Cloud 인프라에 구축된 맞춤형 AI 모델을 활용합니다. Cloud Run과 Compute Engine은 대량의 데이터를 처리하는 데 필요한 확장성과 컴퓨팅 성능을 제공합니다. 이를 통해 Movix는 API를 통해 기존 치과 시스템과 통합할 수 있으며, 전통적으로 보수적인 시장을 공략합니다. 그들의 에이전트 접근 방식은 수동 작업을 자동화하여 치과 보조기의 효율성을 높이고 처리 시간을 단축합니다. 그들의 기술을 사용하는 Orthero는 이미 더 빠르고 일관된 품질 관리를 경험하고 있습니다. Movix의 아키텍처는 보안과 의료 규정 준수를 보장하도록 구축되었습니다. 그들은 2029년까지 전체 치과 보조기 워크플로우를 포괄하는 여러 AI 에이전트를 개발하는 것을 목표로 합니다. Movix는 기존 시스템을 통합하는 하이브리드 솔루션을 제공하여 시장 범위를 확장합니다.
CdXz5zHNQW_TOZCcb84ee.jpeg

AI Studio는 Cloud Run, Firebase, Cloud SQL을 통해 신용카드 없이 풀스택 바이브 코딩을 지원합니다.

Google I/O 2026에서 Google AI Studio와 Google Cloud 간의 통합 업데이트가 발표되었습니다. 신규 사용자는 결제 계정 없이 Google Cloud Starter Tier에 최대 두 개의 풀스택 애플리케이션을 배포할 수 있습니다. 이 통합은 비관계형 데이터의 경우 Firestore, 관계형 옵션의 경우 Cloud SQL을 제공하여 데이터베이스 선택의 폭을 넓힙니다. Sheets와 같은 Google Workspace 도구와의 긴밀한 통합은 Firebase Auth를 통한 사용자 로그인을 통해 이루어집니다. AI 에이전트는 적절한 데이터베이스를 추론하여 개발 프로세스를 간소화합니다. 사용자는 Firebase Auth를 인증용으로, Firestore 또는 Cloud SQL을 데이터 저장용으로 사용하여 Cloud Run에 애플리케이션을 신속하게 배포할 수 있습니다. 이 통합에는 개발자가 애플리케이션에 집중할 수 있도록 하는 자동화된 데이터 기반이 포함됩니다. AI Studio의 Cloud SQL 통합은 PostgreSQL 데이터베이스의 즉각적인 프로비저닝을 제공하며, 개발자 에디션은 자동으로 제로 스케일링됩니다. 앱을 구축할 때 에이전트는 데이터 저장 요구 사항을 감지하고 Firestore 및 Firebase 인증 설정을 제안합니다. Firebase Auth를 통해 앱은 Google Workspace에 연결하고 사용자 데이터에 안전하게 액세스할 수 있습니다.
CdXz5zHNQW_kazS8tBaen.gif

AppLifecycle Manager의 새로운 기능 플래그를 통해 프로덕션에 기능을 배포하는 것이 더욱 쉬워졌습니다.

새로운 기능을 출시하기 전에 두려움이 자주 발생하는데, 특히 AI 기반 코드 생성 속도가 빨라지면서 더욱 그렇습니다. 기능 플래그는 코드 배포와 기능 출시를 분리하여 더 안전한 롤아웃을 가능하게 함으로써 이에 대한 해결책을 제공합니다. Google은 이 원칙을 활용하는 공개 미리보기 서비스인 AppLifecycle Manager Feature Flags(ALM FF)를 출시합니다. ALM FF는 기능 출시를 코드 배포와 분리하여 개발 속도를 향상시키고, 기능 수준 제어를 통해 지속적인 코드 배포를 가능하게 합니다. 이 서비스는 백분율 기반 롤아웃을 통한 점진적인 활성화와 Common Expression Language(CEL)를 사용한 정밀한 사용자 타겟팅을 촉진합니다. 코드 변경이나 인프라 수정 없이 시스템 프롬프트와 같은 동적 구성 업데이트를 허용합니다. ALM FF는 OpenFeature 표준을 기반으로 구축되어 Google 특정 종속성 없이 이식성과 업계 모범 사례를 보장합니다. 팀은 이제 백분율 롤아웃과 정밀한 사용자 타겟팅을 사용하여 릴리스를 제어할 수 있습니다. 이 서비스는 문제가 있는 기능을 즉시 비활성화하여 빠른 킬 스위치 역할을 합니다. AppLifecycle Manager Feature Flags는 소프트웨어 개발에 유용한 도구를 제공합니다.
CdXz5zHNQW_qxBigBILUN.png