Mises à jour de santé du servi... Note

Mises à jour de santé du service Google Cloud via RSS

status.cloud.google.com est le tableau de bord officiel d'état pour les services Google Cloud. Il fournit des informations en temps réel sur l'état actuel de divers services Google Cloud, y compris Compute Engine, App Engine, Cloud Storage, et bien plus encore. Le site web affiche une liste de tous les services Google Cloud, accompagnés de leur état actuel, qui peut être l'un des suivants : - Vert : Le service fonctionne normalement. - Jaune : Le service connaît une panne partielle ou une dégradation. - Rouge : Le service est complètement indisponible. Pour chaque service, le site web affiche également une brève description du problème, si applicable, et l'heure à laquelle le problème a commencé. De plus, le site web propose un historique des incidents et des pannes passés pour chaque service. Le site web est mis à jour en temps réel, permettant aux utilisateurs de vérifier rapidement l'état des services Google Cloud et de planifier en conséquence. Il est une ressource utile pour les développeurs, les administrateurs et les utilisateurs qui dépendent des services Google Cloud pour leurs applications et leurs charges de travail. Le site web propose également des liens vers les rapports d'incident et les analyses de cause racine pour les pannes passées, ce qui peut être utile pour comprendre ce qui s'est mal passé et comment Google Cloud travaille à prévenir de tels problèmes à l'avenir. Dans l'ensemble, le tableau de bord d'état Google Cloud est une ressource transparente et informative qui aide les utilisateurs à rester informés de l'état des services Google Cloud.

Fil de notes

RÉSOLU : Nous enquêtons sur des taux d'erreur élevés avec plusieurs produits dans us-east1

Le 18 juillet 2025, une interruption de service des plateformes Google Cloud Platform (GCP) et Google Workspace (GWS) s'est produite dans la région us-east1, d'une durée maximale de 1 heure et 57 minutes. L'incident a débuté à 7h42 et s'est terminé à 9h47, heure du Pacifique. Une erreur de procédure lors du remplacement planifié du matériel a entraîné une déconnexion incorrecte d'un commutateur réseau. Cela a conduit à une partition du plan de contrôle du réseau, entraînant des informations de topologie obsolètes et une perte de paquets. Le problème a été identifié à 7h06, et les efforts de correction ont commencé immédiatement. Le trafic a été réacheminé pour atténuer l'impact, les services Workspace ayant été rétablis à 8h40. La restauration complète du service a été réalisée à 9h47. L'incident a affecté plusieurs produits GCP et GWS, principalement dans le sud-est des États-Unis. Google met en œuvre des contrôles de sécurité et des mesures préventives pour éviter de futurs incidents. Un petit pourcentage de disques persistants a été brièvement indisponible, mais aucune perte de données ne s'est produite.

RÉSOLU : Nous enquêtons sur des taux d'erreur élevés avec plusieurs produits dans us-east1

Une interruption de service/panne a eu lieu le 18 juillet 2025, entre 07h42 et 09h47 heure du Pacifique. L'incident a affecté plusieurs produits de la plateforme Google Cloud (GCP) et de Google Workspace (GWS) dans la région us-east1. L'impact sur GCP a duré 1 heure et 37 minutes, tandis que l'impact sur GWS a duré 30 minutes. Le problème a causé des latences élevées et des taux d'erreur dans la région affectée. La cause racine du problème était une erreur de procédure lors d'une maintenance matérielle planifiée dans l'un des centres de données de Google dans la région us-east1. L'équipe d'ingénierie a atténué le problème en détournant le trafic loin des clusters et en rétablissant le matériel affecté. Un rapport d'incident complet sera terminé dans les jours suivants, fournissant une cause racine complète et des actions préventives. Les produits affectés ont connu des latences élevées et des taux d'erreur dans la région us-east1. L'incident a affecté un large éventail de produits GCP et GWS, notamment AlloyDB pour PostgreSQL, Apigee, Gmail, Google Meet, et bien d'autres. La localisation affectée était la Caroline du Sud (us-east1).

RÉSOLU : Nous enquêtons sur des taux d'erreur élevés avec plusieurs produits dans us-east1

Un incident s'est produit le 18 juillet 2025, entre 7h42 et 9h47 du matin, heure du Pacifique. Le problème a été résolu pour tous les produits affectés à 9h47 du matin, heure du Pacifique. L'analyse préliminaire suggère que la perte de paquets élevée lors de la maintenance réseau de routine dans la zone us-east1-b a causé la perturbation du service. Un rapport d'incident complet avec la cause racine sera publié une fois les enquêtes internes terminées. L'entreprise remercie les utilisateurs de leur patience pendant le processus de résolution. L'incident a affecté de nombreux produits, notamment AlloyDB pour PostgreSQL, Apigee, Artifact Registry, et bien d'autres. Ces produits ont été impactés dans l'emplacement de Caroline du Sud (us-east1). L'incident n'a pas affecté d'autres emplacements. L'entreprise enquête toujours sur la cause racine du problème. Un rapport détaillé sera publié une fois l'enquête terminée.

MISE À JOUR : Nous enquêtons sur des taux d'erreur élevés avec plusieurs produits dans us-east1

Un incident s'est produit le 18 juillet 2025, débutant à 07h42 heure du Pacifique des États-Unis et se terminant à 09h47 heure du Pacifique des États-Unis. Le problème a affecté le plan de contrôle du réseau dans les zones us-east1, mais les ingénieurs ont réussi à le récupérer avec succès. De nombreux services signalent maintenant une récupération complète, et les ingénieurs produits continuent de valider les services restants. Les produits affectés incluent une grande variété de services Google Cloud, tels que AlloyDB pour PostgreSQL, Apigee et Google Cloud Storage. D'autres produits affectés incluent Cloud Billing, Cloud Build, Cloud External Key Manager et Cloud Firestore, entre autres. L'incident a également affecté divers services Google Cloud, tels que Google App Engine, Google BigQuery et Google Cloud SQL. L'emplacement affecté était la Caroline du Sud, spécifiquement les zones us-east1. Les ingénieurs travaillent toujours pour s'assurer que tous les services sont pleinement opérationnels, et une mise à jour avec plus de détails est attendue pour 11h00 heure du Pacifique le 18 juillet 2025. Les efforts de récupération sont en cours, et l'équipe travaille pour prévenir des incidents similaires à l'avenir. L'incident a été résolu, mais l'équipe continuera à surveiller la situation pour s'assurer que tous les services sont stables et fonctionnent comme attendu.

MISE À JOUR : Nous enquêtons sur des taux d'erreur élevés avec plusieurs produits dans us-east1

L'incident s'est produit le 18 juillet 2025, entre 7h42 et 9h47, heure du Pacifique des États-Unis. Les ingénieurs ont réussi à récupérer le plan de contrôle du réseau dans les zones us-east1 affectées. De nombreux services signalent une récupération complète, et les ingénieurs de produits vérifient les services restants. Une autre mise à jour avec plus de détails sera fournie d'ici 10h30, heure du Pacifique, le 18 juillet 2025. L'incident a affecté divers produits Google Cloud, notamment Apigee, Artifact Registry, Cloud Build, et bien d'autres. Les produits affectés incluent également Google App Engine, Google BigQuery, Google Cloud Bigtable et Google Cloud Console, entre autres. L'incident a touché les emplacements en Caroline du Sud, spécifiquement les zones us-east1. Les efforts de récupération se poursuivent, avec des ingénieurs travaillant à valider les services restants. L'incident a été résolu, et les services reviennent à la normale. Des mises à jour supplémentaires seront fournies pour garantir une transparence et une résolution complètes.

MISE À JOUR : Nous enquêtons sur des taux d'erreur élevés avec plusieurs produits dans us-east1

L'incident a commencé le 18 juillet 2025 à 07h42 et s'est terminé le 18 juillet 2025 à 09h47 (toutes les heures sont en US/Pacific). Nos ingénieurs ont confirmé que la zone us-east1-b est partiellement affectée. Toutes les autres zones dans us-east1 fonctionnent actuellement normalement. Nos ingénieurs ont récupéré le matériel défaillant et sont en train de récupérer le plan de contrôle du réseau dans les zones affectées. Nous fournirons une autre mise à jour à 10h00 AM US/Pacific, le 18 juillet 2025. Produits affectés : Cloud External Key Manager, Cloud HSM, Cloud Key Management Service, Cloud Run, Dialogflow CX, Google App Engine, Google Cloud Bigtable, Google Cloud Dataproc, Google Cloud SQL, Google Cloud Storage, Google Cloud Support, Google Compute Engine, Google Kubernetes Engine, Hybrid Connectivity, Identity and Access Management, Secret Manager, Virtual Private Cloud (VPC) Emplacements affectés : Caroline du Sud (us-east1)

MISE À JOUR : Nous enquêtons sur des taux d'erreur élevés avec plusieurs produits dans us-east1

L'incident a commencé le 18 juillet 2025 à 07h06 (toutes les heures sont en US/Pacific). Nous sommes actuellement confrontés à des temps de latence élevés et des taux d'erreur pour plusieurs services Cloud dans la région us-east1, débutant à 7h06 du matin PDT aujourd'hui, le 18 juillet 2025. Notre enquête initiale pointe vers une défaillance d'infrastructure matérielle comme cause probable. Nous nous excusons pour tout désagrément que cela peut causer. Nous fournirons une mise à jour avec plus de détails d'ici 9h15 du matin PDT aujourd'hui. Produits affectés : Cloud Run, Dialogflow CX, Google App Engine, Google Cloud Bigtable, Google Cloud Dataproc, Google Cloud SQL, Google Cloud Storage, Google Cloud Support, Google Compute Engine, Google Kubernetes Engine, Connectivité hybride, Virtual Private Cloud (VPC) Emplacements affectés : Caroline du Sud (us-east1)

RÉSOLU : Plusieurs produits GCP rencontrent des problèmes de service

"Le 12 juin 2025, Google Cloud, Workspace et les opérations de sécurité ont connu une augmentation des erreurs 503 dans les requêtes d'API externes en raison d'un changement de code défectueux dans Service Control. Une nouvelle fonctionnalité ajoutée le 29 mai 2025 ne disposait pas d'une gestion d'erreurs et d'une protection de drapeau de fonctionnalité appropriées. Un changement de stratégie le 12 juin a déclenché un pointeur null, provoquant l'effondrement du binaire Service Control à l'échelle régionale, puis mondiale. L'équipe d'ingénierie de fiabilité des sites a identifié la cause racine en 10 minutes et a mis en œuvre un bouton rouge pour désactiver le chemin de service problématique. La récupération a commencé dans les 40 minutes, mais les régions plus importantes comme us-central-1 ont connu une surcharge en raison d'un "effet de troupeau". La résolution complète dans us-central-1 a pris environ 2 heures et 40 minutes, avec le trafic réacheminé et la création de tâches bridée. Google a gelé les modifications apportées à la pile Service Control et se concentrera sur la modularisation de l'architecture. Ils auditeront les systèmes utilisant des données répliquées à l'échelle mondiale, appliqueront des drapeaux de fonctionnalité pour les binaires critiques, et amélioreront la gestion des erreurs et les tests. Google prévoit également d'améliorer les communications externes et de garantir que l'infrastructure de surveillance reste opérationnelle pendant les pannes. De nombreux produits Google Cloud dans de nombreuses régions ont été touchés par cet incident."

RÉSOLU : Plusieurs produits GCP rencontrent des problèmes de service

Un incident affectant Google Cloud et Workspace s'est produit le 12 juin 2025, entre 10h49 et 13h49, heure du Pacifique, durant 3 heures. L'incident a entraîné une augmentation des erreurs 503 pour les requêtes API externes, affectant l'accès des clients à l'échelle mondiale. Une mise à jour de quota invalide automatisée dans le système de gestion des API a causé les rejets. La récupération a impliqué la contournement de la vérification de quota problématique, restaurant la majorité des régions dans les deux heures. La région us-central1 a connu une récupération plus longue en raison d'une surcharge de la base de données. Certains produits ont connu un impact résiduel pendant jusqu'à une heure, tandis que quelques autres ont récupéré plus tard. Google prépare un rapport d'incident détaillé exposant la cause racine et les étapes de remédiation. Des mesures seront mises en œuvre pour prévenir les défaillances de gestion des API, améliorer la propagation des métadonnées et renforcer la gestion des erreurs. L'incident a affecté de nombreux produits Google Cloud et Workspace, notamment Compute Engine, BigQuery, Gmail et Google Calendar. L'impact s'est étendu à travers divers emplacements mondiaux.

MISE À JOUR : Plusieurs produits GCP connaissent des problèmes de service

Un incident affectant la prédiction en ligne de Vertex AI et d'autres services Google Cloud a commencé le 12 juin 2025 à 10h51 PDT. L'incident a entraîné des erreurs 5xx élevées pour certains modèles de modèle. Le problème principal a été résolu à 17h05 PDT, rétablissant le service Vertex AI normal dans la plupart des régions. Cependant, les régions europe-west1 et asia-southeast1 connaissaient encore des problèmes de capacité. Les ingénieurs travaillent activement pour rétablir la capacité de service normale dans ces deux régions restantes. Le délai estimé pour la résolution complète dans les régions europe-west1 et asia-southeast1 est de 19h45 PDT. Une mise à jour sur la situation sera fournie à 19h45 PDT le même jour. Un large éventail de produits et services Google Cloud a été affecté par cet incident. L'incident a touché un grand nombre d'emplacement à travers plusieurs régions du monde.

MISE À JOUR : Plusieurs produits GCP connaissent des problèmes de service

Un incident affectant plusieurs produits et emplacements de Google Cloud a commencé le 12 juin 2025 à 10h51 PDT. Le service de santé personnalisé est maintenant résolu et affiche des mises à jour précises. Le problème affectant Google Cloud Dataflow a été entièrement résolu à 17h10 PDT. Cependant, Vertex AI Online Prediction continue d'enregistrer des taux d'erreurs élevés de 5xx, en particulier dans le Jardin de modèles. Les ingénieurs travaillent à atténuer ces erreurs, et une diminution progressive des taux d'erreur est observée. Le délai estimé pour la résolution complète du problème de Vertex AI Online Prediction est de 22h00 PDT. Un large éventail de services Google Cloud a été touché, notamment API Gateway, AlloyDB, Cloud Run, BigQuery, et bien plus encore. L'incident a affecté diverses régions géographiques en Asie, en Europe, en Amérique du Nord, en Amérique du Sud et dans d'autres régions. Une mise à jour avec les derniers détails sera fournie le 12 juin 2025 à 22h00 PDT. Les clients doivent s'attendre à des taux d'erreur continuels sur Vertex AI jusqu'à l'heure estimée.

MISE À JOUR : Plusieurs produits GCP connaissent des problèmes de service

Un incident affectant plusieurs produits Google Cloud a commencé le 12 juin 2025 à 10h51 PDT et s'est terminé à 18h18 PDT. Des impacts résiduels persistent pour Google Cloud Dataflow, en particulier dans us-central1, où la suppression des retards est en cours. Les clients peuvent rencontrer des retards avec les opérations Dataflow dans us-central1, sans ETA pour la récupération complète. Les utilisateurs de Vertex AI Online Prediction peuvent encore rencontrer des erreurs 5xx élevées avec certains modèles de jardin de modèles. Les ingénieurs travaillent à atténuer ces erreurs, visant une résolution complète d'ici 22h00 PDT. Les mises à jour de santé des services personnalisés sont retardées ; les utilisateurs doivent se référer au tableau de bord de santé des services Cloud. Un large éventail de produits Google Cloud ont été affectés, BigQuery, Compute Engine et Cloud Storage. L'incident a touché divers emplacements à travers le monde, couvrant l'Asie, l'Europe et l'Amérique du Nord et du Sud. La prochaine mise à jour sera fournie le 12 juin 2025 à 17h45 PDT.

MISE À JOUR : Plusieurs produits GCP rencontrent des problèmes de service.

Un incident a commencé le 12 juin 2025 à 10h51 heure du Pacifique des États-Unis. Les produits Google Cloud sont toujours affectés, notamment par des retards dans les opérations Dataflow et des erreurs 5xx élevées avec certains modèles de prédiction en ligne Vertex AI. Les mises à jour de santé des services personnalisés sont retardées, et les clients sont invités à utiliser le tableau de bord de santé des services cloud pour obtenir des mises à jour. Il n'y a actuellement pas de délai estimé pour la mitigation complète de ces services. Une mise à jour sera fournie à 17h00 PDT avec des détails actuels. L'incident a affecté de nombreux produits, notamment API Gateway, Cloud Data Fusion, Cloud Firestore, et bien d'autres. Les régions affectées incluent Johannesburg, Taïwan, Hong Kong, Tokyo, et bien d'autres à travers le monde. L'incident a également affecté de nombreux emplacements, notamment asia-south1, asia-northeast1, europe-central2, et d'autres. Les produits et emplacements affectés sont détaillés. L'incident est toujours en cours, et les clients sont invités à surveiller la situation pour obtenir des mises à jour.

MISE À JOUR : Plusieurs produits GCP rencontrent des problèmes de service.

Un incident de Google Cloud a commencé le 12 juin 2025 à 10h51 heure du Pacifique. La plupart des produits Google Cloud ont récupéré entièrement à 13h45 heure du Pacifique. Cependant, certains produits sont toujours affectés, et les utilisateurs doivent continuer à surveiller les services et le tableau de bord pour les récupérations individuelles des produits. Une mise à jour sera fournie à 16h00 heure du Pacifique avec les détails actuels. L'incident a affecté de nombreux produits, notamment API Gateway, Apigee, Cloud Data Fusion, Cloud Firestore, et bien d'autres. Les emplacements affectés incluent Johannesburg, plusieurs régions en Asie, en Europe, en Australie, en Amérique du Sud et aux États-Unis. L'incident a touché un large éventail de régions, notamment africa-south1, asia-east1, europe-central2 et us-west4, entre autres. Les régions affectées sont réparties à travers le monde, notamment en Asie, en Europe et dans les Amériques. Les utilisateurs sont conseillés de continuer à surveiller les services et les récupérations individuelles des produits. L'incident est toujours en cours de traitement, et les utilisateurs seront mis à jour avec les détails actuels à 16h00 heure du Pacifique le 12 juin 2025.

MISE À JOUR : Plusieurs produits GCP rencontrent des problèmes de service.

Un incident Google Cloud a débuté le 12 juin 2025 à 10h51, heure du Pacifique (US). La plupart des produits Google Cloud ont retrouvé un fonctionnement normal. Cependant, quelques services subissent encore des impacts résiduels, et leurs équipes d'ingénierie respectives travaillent activement à leur restauration. La reprise complète est attendue dans moins d'une heure. Une mise à jour sera fournie avant 15h00 PDT avec les détails actuels. L'incident a affecté de nombreux produits Google Cloud, notamment API Gateway, Cloud Data Fusion, Cloud Firestore, et bien d'autres. Les régions affectées incluent Johannesburg, Multi-région : Asie, Taïwan, et de nombreuses autres régions à travers le monde. Les régions impactées s'étendent sur l'Afrique, l'Asie, l'Australie, l'Europe, l'Amérique du Nord et l'Amérique du Sud. L'incident a affecté plusieurs régions, notamment l'Asie, l'UE, l'Amérique du Nord et les États-Unis. Les efforts de restauration sont en cours, et une mise à jour sera prochainement fournie.

MISE À JOUR : Plusieurs produits GCP rencontrent des problèmes de service.

Un incident a débuté le 12 juin 2025 à 10h51, heure du Pacifique (US). Des mesures d'atténuation ont été mises en œuvre dans les régions us-central1 et multi-region/us, et des signes de rétablissement sont observés. Des confirmations issues de la surveillance interne et des clients indiquent un rétablissement dans plusieurs régions, notamment us-central1 et multi-region/us. Une récupération complète est attendue dans l'heure. Une mise à jour sera fournie avant 14h30 PDT avec les détails actuels. L'incident a affecté de nombreux produits Google Cloud, notamment API Gateway, Cloud Data Fusion et Google Cloud Storage. Les emplacements affectés incluent Johannesburg, Taïwan, Tokyo et de nombreuses autres régions du monde. L'incident a impacté plusieurs régions, dont l'Asie, l'UE, l'Amérique du Nord et les États-Unis. Les régions affectées incluent us-central1, asia-east1, europe-north1 et bien d'autres. L'incident est suivi de près et des mises à jour seront fournies dès que possible.

MISE À JOUR : Plusieurs produits GCP rencontrent des problèmes de service.

Un incident a débuté le 12 juin 2025 à 10h51, heure du Pacifique. La cause racine a été identifiée et des mesures correctives ont été appliquées. L'infrastructure a retrouvé son fonctionnement normal dans toutes les régions sauf us-central1. Les produits Google Cloud qui dépendent de l'infrastructure affectée sont en cours de restauration dans plusieurs régions. Les ingénieurs sont conscients des problèmes que rencontrent encore certains clients sur us-central1 et multi-région/us, et travaillent activement à une restauration complète. Il n'y a pas d'estimation de délai pour une restauration complète. Une mise à jour sera fournie avant le jeudi 12 juin 2025 à 14h00 PDT avec les détails actuels. L'incident affecte de nombreux produits Google Cloud, notamment API Gateway, Cloud Data Fusion et Cloud Spanner, entre autres. L'incident affecte également plusieurs sites dans le monde, notamment Johannesburg, Tokyo, Mumbai et Sydney, entre autres.

MISE À JOUR : Plusieurs produits GCP connaissent des problèmes de service

L'incident a commencé le 12 juin 2025 à 10h51 heure du Pacifique des États-Unis. Les ingénieurs ont trouvé la cause racine et appliqué des mesures d'atténuation, mais les clients continuent d'éprouver des degrés variables d'impact sur les produits individuels de Google Cloud. La dépendance sous-jacente a récupéré dans tous les emplacements sauf us-central1. Toutes les équipes d'ingénieurs respectives travaillent sur la récupération du service, mais il n'y a pas de délai estimé pour la récupération complète du service. Une mise à jour sera fournie à 13h30 PDT le 12 juin 2025 avec les détails actuels. Les produits affectés incluent Agent Assist, AlloyDB pour PostgreSQL, Apigee, et bien d'autres. Les emplacements affectés incluent Johannesburg, Région multiple : Asie, Taïwan, et bien d'autres. L'incident a un impact global, affectant plusieurs régions et emplacements. Les ingénieurs sont activement engagés dans la récupération du service, mais l'incident est toujours en cours. La liste complète des produits et emplacements affectés est fournie dans le message original.

MISE À JOUR : Plusieurs produits GCP rencontrent des problèmes de service.

Un incident a commencé le 12 juin 2025 à 10h51 heure du Pacifique des États-Unis. Toutes les localisations sauf us-central1 ont récupéré intégralement, tandis que us-central1 est presque entièrement récupérée. Il n'y a pas de délai estimé pour une récupération complète à us-central1. Une mise à jour sera fournie le 12 juin 2025 à 13h00 heure du Pacifique. L'incident a affecté de nombreux produits, notamment Agent Assist, Cloud Data Fusion, Cloud Firestore, et bien d'autres. Les localisations affectées incluent Johannesburg, Taïwan, Hong Kong, Tokyo, et bien d'autres en Asie, en Europe, en Amérique du Nord et en Amérique du Sud. L'incident a affecté de nombreuses régions, notamment l'Asie, l'Europe, nam5, les États-Unis, et bien d'autres. Les localisations affectées aux États-Unis incluent l'Iowa, la Caroline du Sud, la Virginie du Nord, et bien d'autres. L'incident est toujours en cours, avec une mise à jour attendue bientôt. Les produits et localisations affectés sont nombreux, et l'incident est toujours en cours de résolution.

MISE À JOUR : Plusieurs produits GCP connaissent des problèmes de service

Un incident a commencé le 12 juin 2025 à 10h51 heure du Pacifique des États-Unis. Les ingénieurs travaillent à résoudre le problème, et certains emplacements ont déjà récupéré. Cependant, il n'y a pas encore de délai estimé. Une mise à jour sera fournie d'ici 12h45 HAP avec les derniers détails. L'incident affecte plusieurs services Google Cloud, notamment Cloud Data Fusion, Cloud Memorystore et Cloud Workstations. Les emplacements affectés comprennent Johannesburg, Taïwan, Hong Kong, Tokyo, et de nombreux autres en Asie, en Europe, en Amérique du Nord et en Amérique du Sud. L'incident est mondial, avec de multiples régions affectées aux États-Unis, en Asie et dans d'autres zones. Les produits affectés incluent Google Cloud Bigtable, Google Cloud Console et la plateforme d'identité, entre autres. L'incident est en cours, et les utilisateurs doivent s'attendre à des perturbations jusqu'à nouvel ordre.

MISE À JOUR : Plusieurs produits GCP connaissent des problèmes de service

Un problème de service a débuté le 12 juin 2025 à 10h51 HNP, affectant plusieurs produits de la plateforme Google Cloud (GCP). L'équipe d'ingénierie enquête sur le problème et une mise à jour sera fournie d'ici 12h15 HNP. Le problème cause des impacts de service variables avec les requêtes API. Aucune solution de contournement n'est actuellement disponible. Les produits affectés incluent Cloud Data Fusion, Cloud Memorystore, Cloud Workstations et plusieurs autres. Le problème affecte plusieurs emplacements dans le monde, notamment Johannesburg, Taïwan, Tokyo, Mumbai et bien d'autres. Les emplacements affectés incluent plusieurs régions en Asie, en Europe, en Amérique du Sud et en Amérique du Nord. La perturbation de service cause des inconvénients à tous les utilisateurs affectés. L'équipe d'ingénierie travaille pour résoudre le problème dès que possible.

MISE À JOUR : Plusieurs produits GCP connaissent des problèmes de service

Un problème de service a commencé à affecter plusieurs produits de la plateforme Google Cloud (GCP) le jeudi 12 juin 2025 à 10h51 PDT. L'équipe d'ingénierie enquête sur le problème et fournira une mise à jour d'ici 12h15 PDT avec des détails actuels. Les produits affectés incluent Google Cloud Bigtable, Google Cloud Console, Google Cloud Dataproc, Google Cloud Storage, la plateforme d'identité et la gestion des accès. Le problème affecte plusieurs régions, notamment Johannesburg, la région asiatique, Taïwan, Hong Kong, Tokyo, Osaka, Séoul, Mumbai, Delhi, Singapour, Jakarta et bien d'autres. Les symptômes incluent des niveaux variables d'impact sur les produits affectés. Il n'y a actuellement pas de solution de contournement disponible pour ce problème. L'incident cause des perturbations pour les utilisateurs, et l'équipe s'excuse pour l'inconvenient. Les emplacements affectés incluent la région asiatique, Taïwan, Hong Kong, Tokyo, Osaka, Séoul, Mumbai, Delhi, Singapour, Jakarta et bien d'autres. L'équipe continuera à enquêter et à fournir des mises à jour sur le problème.

RÉSOLU : Problème sur Google Compute Engine (GCE) ayant un impact sur plusieurs services GCP dépendants dans plusieurs zones.

Le 19 mai 2025, Google Compute Engine (GCE) a rencontré des problèmes avec la terminaison des VM Spot, qui ont duré environ 8 heures et 42 minutes. Cela a entraîné une dégradation des performances et des délais d'attente dans des régions spécifiques telles que us-central1 et us-east4. La cause première était un changement de configuration qui a désactivé un "feature flag" (indicateur de fonctionnalité), bloquant ainsi les VM Spot lors de la terminaison. Cela a entraîné un arriéré, impactant les performances pour tous les types de VM dans certaines zones. La surveillance interne a alerté les ingénieurs de Google, qui ont initié une restauration pour résoudre le problème. La restauration, terminée le 20 mai 2025 à 03h55 (heure du Pacifique), a atténué l'impact du problème. Les clients ont constaté une latence accrue pour les opérations du plan de contrôle des VM, affectant en particulier la création, la modification et la suppression des VM. Le problème a affecté divers produits Google Cloud Platform (GCP) qui dépendent de GCE, notamment GKE et Dataflow. Google prend des mesures pour prévenir de futurs incidents, notamment en auditant les contrôles de sécurité et en abordant les problèmes d'évolutivité. Google revoit son approche de déploiement progressif pour éviter des perturbations similaires. L'entreprise s'excuse pour l'impact et s'engage à améliorer la fiabilité de la plateforme.

RÉSOLU : Problème de Google Compute Engine (GCE) affectant plusieurs services GCP dépendants dans plusieurs zones.

Une interruption de service s'est produite du 19 mai 2025, 20h23 au 20 mai 2025, 05h05 (fuseau horaire US/Pacific). L'incident a affecté plusieurs services Google Cloud, notamment Compute Engine, Kubernetes Engine, Cloud Dataflow, Cloud SQL et d'autres. Le problème a été causé par un récent changement de configuration qui a négativement affecté la gestion des terminaisons de machines virtuelles spot par Google Compute Engine, entraînant une surcharge des services de plan de contrôle. Cela a causé des perturbations dans la création, les terminaisons et la consommation de réservation d'instances de machine virtuelle. Le problème a été atténué en rétablissant la configuration précédente, résolvant l'impact sur tous les services affectés. Les clients ont expérimenté une latence élevée ou des timeouts lors d'opérations telles que la création et la terminaison d'instances de machine virtuelle, ainsi que des problèmes avec Cloud Dataproc, Cloud Dataflow, Cloud Build et d'autres services. Un rapport d'incident complet sera achevé dans les jours à venir. Les régions et les zones affectées incluaient us-central1, us-east4 et plusieurs autres zones en Asie, en Europe, en Australie et en Amérique du Sud. L'incident a entraîné divers erreurs, timeouts et échecs dans différents services Google Cloud.

RÉSOLU : Problème de Google Compute Engine (GCE) affectant plusieurs services GCP dépendants dans plusieurs zones.

L'incident a commencé le 2025-05-19 20:23 et s'est terminé le 2025-05-20 05:05 (toutes les heures sont en US/Pacific). Le problème lié à plusieurs services GCP dépendants a été résolu pour tous les utilisateurs affectés à compter du mardi 2025-05-20 05:05 US/Pacific). Nous vous remercions pour votre patience tandis que nous travaillions à résoudre le problème. Produits affectés : AlloyDB pour PostgreSQL, Cloud Build, Cloud Filestore, Colab Enterprise, Google App Engine, Google Cloud Composer, Google Cloud Dataflow, Google Cloud Dataproc, Google Cloud Deploy, Google Cloud SQL, Google Compute Engine, Google Kubernetes Engine, Managed Service for Apache Kafka, Migrate to Virtual Machines Emplacements affectés : Belgique (europe-west1), Iowa (us-central1), Caroline du Sud (us-east1), Virginie du Nord (us-east4), Oregon (us-west1)

MISE À JOUR : Problème de Google Compute Engine (GCE) affectant plusieurs services GCP dépendants à travers les zones

Un incident multi-services affectant la plateforme Google Cloud a débuté le 19 mai 2025 à 20h23 heure du Pacifique. Plusieurs services GCP dépendants ont connu des problèmes tels que des latences élevées et des échecs. L'équipe d'ingénierie a déployé une mesure d'atténuation, observant des améliorations dans les zones affectées. Les services touchés incluaient Dataproc, Compute Engine, Kubernetes Engine, Dataflow, Filestore et Cloud Build. Cloud SQL, Composer, AlloyDB pour PostgreSQL, App Engine, Migrate to Virtual Machines, Vertex GenAI, Cloud Deploy et Memorystore pour Redis étaient également affectés. De nombreux produits touchés ont déjà été atténués. Les clients ont rencontré des problèmes de création d'instances, la mise à l'échelle et la latence opérationnelle. La solution de contournement suggérée consistait à utiliser des zones alternatives pour atténuer l'impact. Les emplacements affectés incluaient la Belgique, l'Iowa, la Caroline du Sud, la Virginie du Nord et l'Oregon. Des informations supplémentaires devaient être publiées le 20 mai 2025 à 05h30 heure du Pacifique, avec la fin de l'incident à 05h05.

MISE À JOUR : Problème de Google Compute Engine (GCE) affectant plusieurs services GCP dépendants à travers les zones

À partir du 19 mai 2025, à 20h23, heure du Pacifique des États-Unis, de nombreux services Google Cloud ont rencontré des problèmes. L'incident a affecté Google Compute Engine, Kubernetes Engine, Dataflow, SQL, AlloyDB, Composer, Build, Dataproc, Filestore et App Engine Flexible. Les utilisateurs ont pu rencontrer une latence accrue, des timeouts ou des échecs dans diverses opérations telles que la création, la suppression, la redimensionnement ou la mise à jour d'instances et de clusters. Le problème a affecté les zones de Belgique, Iowa, Caroline du Sud, Virginie du Nord et Oregon. L'équipe d'ingénierie de Google a déployé une solution et des améliorations ont été observées dans toutes les zones affectées. En guise de solution de contournement, les clients ont été conseillés d'utiliser des zones alternatives pour éviter l'impact. Les clients de Cloud Build ont connu une latence élevée dans la complétion des builds ou des échecs de build sporadiques. Les utilisateurs de Cloud SQL qui ont rencontré des échecs dans les opérations de création ont été conseillés de réessayer après avoir supprimé les instances échouées. Les utilisateurs de Cloud Composer ont vu des échecs dans la création d'environnements, les mises à jour et les retards dans la mise à l'échelle des travailleurs Airflow. Une mise à jour avec plus d'informations était prévue pour le 20 mai 2025, à 05h00, heure du Pacifique, et l'incident s'est terminé à ce moment-là.

MISE À JOUR : Problème de Google Compute Engine (GCE) affectant plusieurs services GCP dépendants à travers les zones

Un incident multi-services affectant les produits Google Cloud a débuté le 19 mai 2025 à 20h23 heure du Pacifique. L'incident affecte des services tels que Compute Engine, Kubernetes Engine, Dataflow, SQL, AlloyDB, Composer, Build, Dataproc, Filestore et App Engine. Les utilisateurs peuvent rencontrer des latences accrues, des timeouts ou des échecs dans diverses opérations au sein de ces services. L'équipe d'ingénierie travaille activement à la mitigation sans ETA actuelle. Les opérations affectées incluent la création d'instances, la mise à jour, la mise à l'échappatoire et la mise à l'échelle. Un contournement possible consiste à utiliser des zones alternatives pour éviter les régions impactées. Les emplacements affectés sont la Belgique, la Caroline du Sud, le Nord de la Virginie et l'Oregon. L'incident affecte également les pools par défaut et privés dans Cloud Build. Les clients qui rencontrent des échecs dans les opérations Cloud SQL peuvent réessayer après avoir supprimé les instances échouées. Une mise à jour est attendue le 20 mai 2025 à 04h30 heure du Pacifique.

RÉSOLU : Les clients rencontrent des problèmes de connectivité avec plusieurs services Google Cloud dans la zone us-east5-c

Le 29 mars 2025, les services Google Cloud dans la zone us-east5-c ont connu une dégradation du service pendant plus de six heures en raison d'une panne de courant. La cause profonde était une défaillance du système d'alimentation sans interruption (UPS) lorsque l'alimentation électrique a été perdue. Une défaillance critique de la batterie au sein de l'UPS l'a empêché de fournir une alimentation continue, entraînant une interruption de fonctionnement des machines virtuelles et une perte de paquets. Les ingénieurs de Google ont été alertés et ont détourné le trafic, rétablissant l'alimentation via un générateur après presque deux heures. Certains services ont nécessité des actions manuelles pour une récupération complète, prolongeant les temps de restauration. Google travaille avec le fournisseur d'UPS et renforce la récupération de l'alimentation du cluster pour éviter une récidive. Les services touchés comprenaient AlloyDB, BigQuery, Bigtable, Composer, Dataflow, Filestore et d'autres, avec des niveaux de perturbation variables. Les clients ont connu une indisponibilité, une latence accrue et des erreurs en fonction du service et des dépendances zonales. L'incident a affecté l'emplacement de Columbus (us-east5), impactant divers produits qui dépendent de la zone touchée. Google s'est excusé pour la perturbation et s'engage à améliorer la fiabilité de la plateforme.

RÉSOLU : Les clients rencontrent des problèmes de connectivité avec plusieurs services Google Cloud dans la zone us-east5-c.

Un incident Google Cloud s'est produit le 29 mars 2025, entre 12h53 et 19h15, heure du Pacifique (USA), soit une durée de 6 heures et 19 minutes. Cet incident a affecté plusieurs produits Google Cloud dans la région us-east5-c, entraînant une indisponibilité de certaines ressources zonales. La cause principale était une panne de courant et une défaillance des batteries du système d'alimentation sans interruption (ASI). Cela a empêché le transfert de l'alimentation vers les générateurs, provoquant des temps d'arrêt pour certaines instances Compute Engine et une perte de paquets au sein de la zone. Des contraintes de capacité ont également été constatées pour Google Kubernetes Engine dans d'autres zones de us-east5. Un petit nombre de disques persistants sont restés indisponibles pendant la panne. Les ingénieurs ont atténué l'impact en détournant le trafic de l'emplacement affecté et en contournant l'ASI défaillant pour rétablir l'alimentation via le générateur. L'incident a été entièrement résolu à 19h12, heure du Pacifique (USA), le 29 mars 2025. Un rapport d'incident complet sera établi dans les jours suivants, fournissant une analyse détaillée des causes profondes. La zone us-east5-c est depuis revenue à son alimentation principale sans autre impact, à compter du 30 mars 2025 à 17h30, heure du Pacifique (USA).

RÉSOLU : Taux élevé d'erreurs « 500 » observé sur Gemini 1.5 Flash et Gemini 1.5 Pro 002

Le 7 janvier 2025, de 13h28 à 21h18 (heure du Pacifique), un problème technique a affecté les utilisateurs de l'API Vertex Gemini dans plusieurs endroits du monde. Les produits concernés étaient l'API Vertex Gemini. Le problème a été résolu à 21h18 (heure du Pacifique) le même jour. Les régions affectées incluaient Taïwan, Hong Kong, Tokyo, Séoul, Mumbai, Singapour, Sydney, Varsovie, la Finlande, Madrid, la Belgique, Londres, Francfort, les Pays-Bas, Zurich, Milan, Paris, Doha, Dammam, Tel Aviv, Montréal, Sao Paulo, l'Iowa, la Caroline du Sud, la Virginie du Nord, Columbus, Dallas, l'Oregon et Las Vegas.

MISE À JOUR : Un taux élevé d'erreurs '500' observé sur Gemini 1.5 Flash et Gemini 1.5 Pro 002

Le 7 janvier 2025 à 13h28 PST, un problème avec l'API Vertex Gemini a causé un taux élevé d'erreurs "500" sur Gemini 1.5 Flash et Pro 002. Les équipes d'ingénierie travaillent à résoudre le problème sur les deux plateformes. Gemini 1.5 Flash affiche des progrès constants, et le taux d'erreur sur Gemini 1.5 Pro 002 a diminué à 1-3 %. Une résolution complète est attendue après l'application des mesures correctives. Les clients peuvent rencontrer des erreurs "500" intermittentes jusqu'à la résolution du problème. Une mise à jour sera fournie le 7 janvier 2025 à 23h30 PST. Le problème affecte plusieurs régions, notamment Asia-East1, Asia-Northeast1, Europe-Central2 et North America-Northeast1.

MISE À JOUR : Taux élevé d’erreurs « 500 » observé sur Gemini 1.5 Flash et Gemini 1.5 Pro 002

Le 7 janvier 2025, l'API Vertex Gemini a rencontré un problème provoquant des erreurs intermittentes "500" sur Gemini 1.5 Flash et Gemini 1.5 Pro 002. L'incident a commencé à 13h28 heure du Pacifique (US) et est toujours en cours à 21h18 heure du Pacifique (US). Gemini 1.5 Flash est en cours de restauration, l'équipe d'ingénierie mettant en œuvre des mesures pour éviter que le problème ne se reproduise. Gemini 1.5 Pro 002 est dans les phases finales de résolution, le taux d'erreur diminuant à environ 1 à 3 %. Les clients peuvent rencontrer des messages d'erreur "500" de manière intermittente. Aucune solution de contournement n'est actuellement disponible. Les produits affectés incluent l'API Vertex Gemini, et le problème touche des emplacements dans le monde entier, notamment Taïwan, Hong Kong, Tokyo, Séoul, Mumbai, Singapour, Sydney, Varsovie, Finlande, Madrid, Belgique, Londres, Francfort, Pays-Bas, Zurich, Milan, Paris, Doha, Dammam, Tel Aviv, Montréal, Sao Paulo, Iowa, Caroline du Sud, Virginie du Nord, Columbus, Dallas, Oregon et Las Vegas. Une mise à jour est attendue pour 21h00 heure du Pacifique (US) le mardi 7 janvier 2025, avec plus de détails.

MISE À JOUR : Taux élevé d’erreurs « 500 » observées sur Gemini 1.5 Flash et Gemini 1.5 Pro 002

Un problème lié à l'API Vertex Gemini, provoquant des erreurs « 500 » intermittentes, a débuté le 7 janvier 2025 à 13 h 28 PST. Le problème concerne les modèles Gemini 1.5 Flash et Gemini 1.5 Pro 002. L'équipe d'ingénierie travaille activement à la résolution de ce problème. Des progrès significatifs ont été réalisés sur le modèle Gemini 1.5 Pro 002. Une mise à jour est attendue d'ici 19 h 30 PST le 7 janvier 2025. Actuellement, aucune solution n'est disponible pour les utilisateurs concernés. Ce problème affecte de nombreuses régions du monde. Les produits concernés incluent l'API Vertex Gemini. De nombreux emplacements à travers le monde rencontrent cette erreur.

MISE À JOUR : Taux élevé d’erreurs « 500 » observé sur Gemini 1.5 Flash et Gemini 1.5 Pro 002.

Le 7 janvier 2025 à 13h28 PST, un taux élevé d'erreurs "500" a été détecté sur l'API Vertex Gemini, impactant spécifiquement Gemini 1.5 Flash et Gemini 1.5 Pro 002. Le problème est intermittent et affecte plusieurs régions du monde. Les ingénieurs ont identifié une solution potentielle et ont mis en œuvre une stratégie d'atténuation. Une diminution subséquente des erreurs "500" a été observée. Une mise à jour avec plus de détails est attendue pour 18h00 PST le 7 janvier 2025. Actuellement, il n'existe aucune solution de contournement pour les utilisateurs rencontrant ces erreurs. Le produit affecté est l'API Vertex Gemini. Le problème touche une large zone géographique mondiale. Le problème fait l'objet d'une enquête et d'une résolution active.

MISE À JOUR : Taux élevé d’erreurs « 500 » observé sur Gemini 1.5 Flash et Gemini 1.5 Pro 002.

Un problème avec l'API Vertex Gemini provoquant des erreurs « 500 » intermittentes est apparu le 7 janvier 2025 à 13 h 28, heure du Pacifique. Le problème affecte Gemini 1.5 Flash et Gemini 1.5 Pro 002. Plusieurs régions dans le monde sont concernées par ce problème. L'équipe d'ingénierie recherche activement la cause première. Aucune solution de contournement n'est actuellement disponible. Une mise à jour est prévue pour 16 h 30, heure du Pacifique, le 7 janvier 2025. Les produits concernés incluent l'API Vertex Gemini. La panne a un impact sur un large éventail d'emplacements géographiques sur plusieurs continents. L'enquête en cours vise à résoudre le problème d'erreur « 500 » le plus rapidement possible.

MISE À JOUR : Taux élevé d'erreurs « 500 » observé sur Gemini 1.5 Flash et Gemini 1.5 Pro 002

Un problème avec l'API Vertex Gemini, provoquant des erreurs intermittentes "500", a commencé le 7 janvier 2025 à 13h28 PST. Ce problème affecte Gemini 1.5 Flash et fait l'objet d'une investigation. Une mise à jour est attendue pour 16h00 PST le même jour. Les utilisateurs affectés rencontrent des messages d'erreur "500" sporadiques. Actuellement, aucune solution de contournement n'est disponible. Le produit impacté est l'API Vertex Gemini. Plusieurs zones géographiques sont affectées, incluant des régions d'Asie, d'Europe, du Moyen-Orient, d'Amérique du Nord et d'Amérique du Sud. Les régions spécifiques s'étendent sur plusieurs continents et pays. L'équipe d'ingénierie travaille activement à la résolution du problème. Des excuses ont été présentées pour cette interruption de service.

RÉSOLU : Certains clients Apigee X ont rencontré des problèmes de connexion aux portails développeurs intégrés utilisant SAML.

Un incident Apigee s'est produit du 12h51 à 15h30, heure du Pacifique (US), le 7 janvier 2025. Le problème a affecté de nombreuses régions du globe, notamment en Asie, en Europe, au Moyen-Orient, en Amérique du Nord et en Amérique du Sud. Plus précisément, les régions touchées incluent, sans s'y limiter, Taïwan, Hong Kong, le Japon, l'Inde, Singapour, l'Australie et divers pays européens. Les États-Unis ont également subi des interruptions dans plusieurs régions. Le service Apigee a été entièrement restauré à 15h22, heure du Pacifique (US). L'incident a duré environ trois heures. Tous les utilisateurs affectés ont désormais accès à Apigee. La société a exprimé sa gratitude pour la patience dont ont fait preuve les utilisateurs pendant la résolution du problème.

MISE À JOUR : Certains clients Apigee X ont rencontré des problèmes de connexion aux portails développeurs intégrés utilisant SAML.

Une interruption de service Apigee X s'est produite entre 12h51 et 15h30 PST le 7 janvier 2025. Ce problème a affecté la connexion des clients aux portails développeurs intégrés utilisant l'authentification SAML. Les ingénieurs enquêtent activement sur le problème. Une mise à jour était prévue pour 17h00 PST le 7 janvier 2025. Actuellement, aucune solution de contournement n'est disponible. L'interruption a impacté les utilisateurs Apigee à l'échelle mondiale, dans de nombreuses régions. Des excuses ont été présentées pour les désagréments causés par cette panne. L'incident a impliqué des problèmes intermittents de fonctionnalité Apigee X. Les emplacements affectés se répartissaient sur plusieurs continents et régions.

MISE À JOUR : certains clients Apigee X ont rencontré des problèmes de connexion aux portails développeurs intégrés via SAML.

Un problème intermittent avec Apigee X s'est produit de 12 h 51 à 15 h 30 (heure du Pacifique) le 7 janvier 2025, affectant les clients qui utilisent SAML pour se connecter aux portails développeurs intégrés. Les emplacements affectés couvrent diverses régions, notamment Taïwan, Hong Kong, Tokyo, Mumbai, Delhi, Singapour, Sydney, Melbourne, Varsovie, Finlande, Madrid, Belgique, Turin, Londres, Francfort, Pays-Bas, Zurich, Milan, Paris, Doha, Dammam, Tel Aviv, Montréal, Toronto, Mexique, São Paulo, Santiago, Iowa, Caroline du Sud, Virginie du Nord, Columbus, Dallas, Oregon, Los Angeles, Salt Lake City et Las Vegas. L'équipe d'ingénieurs étudie le problème, et une mise à jour est attendue d'ici 15 h 00 (heure du Pacifique) le même jour. À l'heure actuelle, aucune solution de contournement n'est disponible.

MISE À JOUR : certains clients Apigee X ont rencontré des problèmes pour se connecter aux portails de développeurs intégrés à l'aide de SAML.

Un problème intermittent a affecté les clients d'Apigee et d'Apigee Edge Public Cloud le 7 janvier 2025, de 12 h 51 à 15 h 30 PST. Les clients ont rencontré des difficultés pour se connecter aux portails développeurs intégrés à l'aide de l'authentification SAML. Ce problème a eu un impact sur les clients de différents endroits du monde. Les équipes d'ingénieurs ont activement étudié le problème. À 14 h 03 PST, aucune solution de contournement n'était disponible. Les produits concernés étaient Apigee et Apigee Edge Public Cloud. La perturbation s'est excusée pour tout inconvénient causé aux clients concernés.

RÉSOLU : Les clients de Cloud Console qui tentent d'obtenir un support via le chat peuvent rencontrer des latences plus élevées ou des erreurs.

L'incident a commencé le 06/01/2025 à 11:01 et s'est terminé le 06/01/2025 à 12:24 (tous les horaires sont en US/Pacifique). Le problème avec Google Cloud Console, Google Cloud Support a été résolu pour tous les utilisateurs affectés à compter du lundi 06/01/2025 à 11:45 en US/Pacifique. Seules quelques instances de chat ont été impactées pendant l'incident. Nous vous remercions pour votre patience pendant que nous travaillions à résoudre le problème. Produits affectés : Google Cloud Console, Google Cloud Support Emplacements affectés : Monde

MISE À JOUR : les clients de la console Cloud essayant d'obtenir une assistance par chat peuvent rencontrer une latence plus élevée ou des erreurs.

L'incident a commencé le 06/01/2025 à 11:01 et s'est terminé le 06/01/2025 à 12:24 (heures US/Pacifique). Résumé : Les clients de Cloud Console qui tentent d'obtenir une assistance via le chat peuvent subir une latence plus élevée ou des erreurs. Description : Nous rencontrons un problème avec Google Cloud Console et le service d'assistance Cloud. Notre équipe d'ingénierie continue d'enquêter sur le problème. Nous fournirons une mise à jour le lundi 06/01/2025 à 13:00 (US/Pacifique) avec des détails actualisés. Nous présentons nos excuses à tous ceux qui sont touchés par la perturbation. Diagnostic : Les utilisateurs qui contactent le service d'assistance peuvent subir des réponses à latence plus élevée ou aucune réponse du tout. Solution de contournement : Les utilisateurs peuvent créer des dossiers d'assistance au lieu d'interagir via le chat. Produits concernés : Google Cloud Console, service d'assistance Cloud Google Emplacements concernés : Monde

RÉSOLU : Les clients de l'API Vertex Gemini et de Vertex AI dans Firebase dans la région us-central1 rencontrent des erreurs élevées pour les requêtes vers les modèles Gemini

L'incident a commencé le 19 décembre 2024 à 11h36 et s'est terminé le 19 décembre 2024 à 17h35 (toutes les heures sont en US/Pacific). Le problème avec l'API Vertex Gemini a été résolu pour tous les utilisateurs affectés à compter du jeudi 19 décembre 2024 à 17h30 US/Pacific. Nous vous remercions de votre patience tandis que nous travaillions à résoudre le problème. Produits affectés : API Vertex Gemini Emplacements affectés : Iowa (us-central1)

MISE À JOUR : Les clients de l'API Vertex Gemini et de Vertex AI dans Firebase dans la région us-central1 rencontrent des erreurs élevées pour les requêtes vers les modèles Gemini

Un incident s'est produit le 19 décembre 2024, de 11h36 à 17h35 heure US/Pacifique, affectant l'API Vertex Gemini et Vertex AI dans Firebase pour les clients de la région us-central1. Le problème a causé une augmentation des erreurs pour les requêtes aux modèles Gemini, avec une augmentation des taux d'erreurs INTERNES dans les appels à StreamGenerateContent et GenerateContent. L'équipe d'ingénierie travaille sur une solution d'atténuation, mais un délai estimé d'achèvement n'est pas encore disponible, avec une mise à jour supplémentaire attendue pour 22h00 US/Pacifique le 19 décembre 2024. En attendant, il est conseillé aux clients de rediriger le trafic vers une autre région si cela est possible.

MISE À JOUR : Les clients de l'API Vertex Gemini et de Vertex AI dans Firebase dans la région us-central1 rencontrent des erreurs élevées pour les requêtes vers les modèles Gemini

Un incident s'est produit le 19 décembre 2024, commençant à 11h36 et se terminant à 17h35 heure US/Pacifique. Le problème a affecté l'API Vertex Gemini et Vertex AI dans Firebase pour les clients de la région us-central1. Ces clients ont rencontré des erreurs élevées lorsqu'ils ont effectué des requêtes sur les modèles Gemini. Le problème a commencé à 11h36 heure US/Pacifique le jeudi 19 décembre 2024. Les ingénieurs ont enquêté activement sur la cause racine du problème et ont testé une éventuelle solution. Une mise à jour était attendue pour 19h00 heure US/Pacifique le même jour. La perturbation a affecté les clients de l'API Vertex Gemini dans la région us-central1, qui ont rencontré des erreurs élevées pour les requêtes sur les modèles Gemini. De plus, les clients de Vertex AI dans Firebase ont pu rencontrer des taux accrus d'erreurs INTERNES lorsqu'ils ont effectué des appels à StreamGenerateContent et GenerateContent dans la région us-central1. En guise de solution de contournement, les clients ont été invités à rediriger le trafic vers une autre région si cela était possible. Les produits affectés comprenaient l'API Vertex Gemini, et l'emplacement affecté était l'Iowa, plus précisément la région us-central1.

RÉSOLU: Nous rencontrons un problème avec l'API Vertex Gemini en Asie

Une interruption de service s'est produite le 19 décembre 2024, commençant à 08:25 et se terminant à 11:05 heure du Pacifique (US/Pacific). L'incident a duré environ 2 heures et 40 minutes, causant des inconvénients aux clients. Le service affecté était l'API Vertex Gemini, spécifiquement dans la région multi-région:asia. Les clients envoyant du trafic vers les modèles de gemini dans cette région ont connu une augmentation des erreurs 5xx, atteignant jusqu'à 100% pendant l'incident. La cause racine de l'incident a été attribuée à une dépendance de service Vertex qui est tombée dans un état défavorable en raison d'un processus de configuration. Pour atténuer la situation, les ressources ont été augmentées et le scaling automatique a été activé, ce qui a réduit les erreurs de trafic client. La dépendance de service Vertex a également reçu une mise à jour pour corriger le problème de configuration et empêcher l'incident de se reproduire. Les emplacements affectés comprenaient Taïwan, Hong Kong, Tokyo, Séoul, Mumbai et Singapour, tous situés dans la région asiatique. L'incident a eu un impact significatif sur les clients, qui ont connu un taux élevé d'erreurs lors de l'envoi de trafic vers les modèles de gemini. Le produit affecté était l'API Vertex Gemini, et les clients qui ont connu un impact en dehors de ce qui est énuméré peuvent contacter le support Google Cloud pour de l'aide supplémentaire.

MISE À JOUR : Les clients de l'API Vertex Gemini et de Vertex AI dans Firebase situés dans la région us-central1 rencontrent des erreurs élevées pour les requêtes aux modèles Gemini

L'incident a commencé le 19 décembre 2024 à 11h36 (heure du Pacifique) et s'est terminé à 17h35 (heure du Pacifique). Les clients de l'API Vertex Gemini et de Vertex AI dans Firebase dans la région us-central1 ont été affectés, connaissant une augmentation des erreurs pour les requêtes aux modèles Gemini. Le problème a commencé à 11h36 (heure du Pacifique) le 19 décembre 2024. Les ingénieurs ont enquêté activement sur la cause profonde et ont testé une éventuelle solution. Une mise à jour a été promise pour 14h15 (heure du Pacifique) le même jour. L'incident a causé des perturbations aux clients affectés, et des excuses ont été présentées. Le diagnostic a révélé que les clients de l'API Vertex Gemini dans la région us-central1 ont connu une augmentation des erreurs pour les requêtes aux modèles Gemini. De plus, les appels à StreamGenerateContent et GenerateContent de Vertex AI dans Firebase peuvent avoir connu des taux d'erreurs internes plus élevés dans la région us-central1. En guise de solution temporaire, les clients ont été invités à rediriger le trafic vers une autre région si cela était possible. Les produits affectés étaient l'API Vertex Gemini, et l'emplacement affecté était l'Iowa (us-central1).

MISE À JOUR : L'API Vertex Gemini et Vertex AI pour les clients Firebase dans us-central1 rencontrent des taux d'erreur élevés pour les requêtes aux modèles Gemini.

Une interruption de service s'est produite, affectant l'API Vertex Gemini et Vertex AI dans Firebase. L'incident a commencé à 11h36 et s'est terminé à 17h35 (heure du Pacifique) le 19 décembre 2024. Le problème concernait des taux d'erreurs élevés pour les requêtes aux modèles Gemini dans la région us-central1 (Iowa). Les ingénieurs ont enquêté et testé une solution potentielle. Une mise à jour a été promise pour 14h (heure du Pacifique). L'interruption a spécifiquement affecté les utilisateurs de l'API Vertex Gemini. Une solution de contournement consistait à rediriger le trafic vers d'autres régions. Le problème principal était les taux d'erreurs élevés pour les requêtes de modèles Gemini. Des excuses ont été présentées pour l'interruption de service. L'incident a affecté les clients de la région us-central1.

MISE À JOUR : Les clients de l'API Vertex Gemini et de Vertex AI dans Firebase dans la région us-central1 rencontrent des erreurs accrues pour les requêtes aux modèles Gemini

L'incident a commencé le 19/12/2024 à 11:36 et s'est terminé le 19/12/2024 à 17:35 (toutes les heures sont en US/Pacific). Résumé: Les clients de l'API Vertex Gemini dans us-central1 connaissent des taux d'erreur élevés pour les requêtes aux modèles Gemini. Description: Nous rencontrons un problème avec l'API Vertex Gemini à partir du jeudi 19/12/2024 à 11:36 US/Pacific. Nos ingénieurs enquêtent activement sur la cause racine du problème et testent actuellement une solution potentielle. Nous fournirons une mise à jour d'ici le jeudi 19/12/2024 à 13:15 US/Pacific avec des informations actuelles. Nous nous excusons auprès de tous ceux qui sont affectés par cette perturbation. Diagnostic: Les utilisateurs de l'API Vertex Gemini dans us-central1 connaissent des taux d'erreur élevés pour les requêtes aux modèles Gemini. Solution de contournement: Les clients peuvent rediriger le trafic vers une région alternative si cela est possible. Produits affectés: API Vertex Gemini Lieux affectés: Iowa (us-central1)