この投稿では、データストレージにAmazon Simple Storage Service(Amazon S3)、スキーマ管理にAWS Glue Data Catalog、そして1回限りのクエリにAmazon Athenaを組み合わせることで、ソリューションを構築する方法を示します。特に、スキーマが頻繁に変更される可能性があるパーティション化されたS3バケット内のAvro形式のデータの処理に焦点を当て、スキーマのバージョンに関係なく、すべてのデータに対して一貫性のあるクエリ機能を提供する方法について説明します。
aws.amazon.com
Build an analytics pipeline that is resilient to Avro schema changes using Amazon Athena
