Amazon SageMaker 카탈로그, 이제 Amazon S3 Tables를 통해 자산 메타데이터를 Apache Iceberg 테이블로 내보냅니다.
이제 데이터 팀은 Amazon SageMaker 카탈로그의 자산 메타데이터를 Apache Iceberg 테이블로 내보낼 수 있습니다. 이를 통해 데이터 팀은 "지난달에 등록된 자산은 몇 개인가?", "어떤 자산이 기밀로 분류되었는가?", 또는 "어떤 자산에 비즈니스 설명이 없는가?"와 같은 질문에 대한 답을 얻기 위해 보고를 위한 사용자 지정 ETL 인프라를 구축하지 않고도 표준 SQL을 사용하여 카탈로그 인벤토리를 쿼리할 수 있습니다.
이 기능을 통해 카탈로그 자산 메타데이터는 Amazon Athena, SageMaker Unified Studio 노트북, AI 에이전트 및 기타 분석 및 BI 도구에서 쿼리 가능한 테이블로 자동 변환됩니다. 내보낸 테이블에는 기술 메타데이터(예: resource_id, resource_type), 비즈니스 메타데이터(예: asset_name, business_description), 소유권 세부 정보 및 타임스탬프가 포함됩니다. 데이터는 time travel 쿼리를 위해 snapshot_date별로 파티션되며, aws-sagemaker-catalog 버킷 아래의 SageMaker Unified Studio에 자동으로 표시됩니다.
이 기능은 SageMaker 카탈로그가 지원되는 모든 AWS 리전에서 추가 비용 없이 사용할 수 있습니다. S3 Tables 스토리지 및 Amazon Athena 쿼리를 포함한 기본 서비스에 대해서만 비용을 지불합니다. 내보낸 테이블에 보존 정책을 설정하여 지정된 기간보다 오래된 레코드를 자동으로 제거함으로써 스토리지 비용을 제어할 수 있습니다. 시작하려면 AWS CLI를 사용하여 데이터 세트 내보내기를 활성화한 다음, 24시간 이내에 S3 Tables 또는 SageMaker Unified Studio의 데이터 탭을 통해 자산 테이블에 액세스하십시오. Amazon Athena, Studio 노트북을 사용하여 쿼리하거나 S3 Tables Iceberg REST 카탈로그 엔드포인트를 통해 외부 BI 도구를 연결하십시오. 자세한 지침은 Amazon SageMaker 사용자 가이드를 참조하십시오.
aws.amazon.com
Amazon SageMaker Catalog now exports asset metadata as queryable dataset
