2025년 1월 24일, AppSheet 고객들은 500 오류와 타임아웃으로 인해 앱을 로드하는 데 문제가 발생했으며, us-east4 및 europe-west4 지역에서 약 60%의 요청에 영향을 미쳤습니다. 이 문제는 1시간 50분 동안 지속되었습니다. 프로덕션에서 데이터베이스 스키마 마이그레이션이 이 사고를 유발했으며, 주요 데이터베이스에서 실패와 타임아웃을 발생시켰습니다. 이 마이그레이션은 재시도 요청의 급증을 유발했으며, 영향을 받은 지역에서 보조 인증 데이터베이스가 요청에 응답하지 못하게 되었습니다. 인증 데이터베이스에는 사용자 인증 토큰이 저장되어 있으며, 이 문제는 us-central1 및 us-west1 지역으로 트래픽을 마이그레이션함으로써 해결되었습니다. 그러나 이는 사용자 워크스페이스 라이선스 권한을 확인하는 서비스에 대한 부하를 증가시켰으며, 95%의 트래픽에 대한 공격적인 부하 감소 및 지연을 유발했습니다. Google 엔지니어들은 이 중단에 대해 경고를 받았고, 영향을 완화하기 위해 트래픽을 재지향했습니다. 이 문제는 인증 데이터베이스를 복원하고 us-east4 및 europe-west4 지역으로 트래픽을 점진적으로 되돌림으로써 11시 20분(US/Pacific)에 해결되었습니다. 유사한 사고를 방지하기 위해 Google는 라이선스 서버 트래픽에 대한 경고 및 모니터링을 개선하고, 라이선스 서버에 대한 의존도를 줄이고, 인증 데이터베이스의 안정성을 높이는 조치를 검토하고 있습니다. 이 사고는 네덜란드와 버지니아 북부의 AppSheet 고객에게 영향을 미쳤으며, 실패한 요청, 오류 증가 및 간헐적인 지연을 경험했습니다. Google은 이 중단에 대해 사과하며, tương lai에는 유사한 사고를 방지하기 위해 노력할 것입니다.
status.cloud.google.com
RESOLVED: Appsheet is unavailable in us-east4 and europe-west4
