RSS DZone.com

5 Ключевых Функций Apache Iceberg для Современных Хранилищ Данных

"Большие данные значительно эволюционировали с момента их появления в конце 2000-х годов. Многие организации быстро адаптировались к этому тренду и построили свои платформы больших данных с помощью открытых инструментов, таких как Apache Hadoop. Позже эти компании столкнулись с трудностями в управлении быстро эволюционирующими потребностями в обработке данных. Они столкнулись с проблемами при изменении схемы уровня, эволюции схемы разделения и возвращении к данным в прошлом. Я столкнулся с аналогичными проблемами при проектировании крупномасштабных распределенных систем в 2010-х годах для крупной технологической компании и клиента из сферы здравоохранения. Некоторые отрасли нуждаются в этих возможностях для соблюдения регулятивных требований банковской, финансовой и медицинской отраслей. Компании, ориентированные на данные, такие как Netflix, столкнулись с аналогичными проблемами. Они изобрели формат таблицы под названием "Ледник", который расположен поверх существующих файлов данных и обеспечивает ключевые функции, используя свою архитектуру. Это быстро стало одним из ведущих проектов ASF, получившим быстрый интерес в сообществе данных. В этой статье я рассмотрю 5 ключевых функций Apache Iceberg с примерами и диаграммами."
dzone.com
Top 5 Key Features of Apache Iceberg for Modern Data Lakes
Create attached notes ...