RSS Etsy Engineering | Code as Craft

Добавление зональной устойчивости в кластер Kafka на Etsy: Часть 1

В 2018 году Etsy перенесла свои брокеры Kafka на Google Cloud Platform's Kubernetes Engine. Изначально работавшие в одной зоне, команда позже переработала архитектуру для обеспечения устойчивости к зонам, распределяя брокеров по нескольким зонам с равномерным распределением реплик разделов. Чтобы обеспечить миграцию без простоя, брокеры были перемещены сначала путем создания снимков дисков, а затем рекреации их в соответствующих зонах. Перемещение разделов было обработано вручную с помощью сценариев и инструментов, чтобы минимизировать движение данных и воздействие. Тестирование в производственной среде после миграции продемонстрировало эффективность многозональной конструкции, с минимальным нарушением работы во время сбоя в зоне. Хотя затраты на межзональную сеть увеличилась, как и ожидалось, преимущества зональной устойчивости перевешивают затраты. Команда оптимизирует затраты, используя функцию follower fetching Kafka и изучает дополнительные подходы для уменьшения межзонального трафика. Несмотря на некоторые увеличения затрат, преимущества зональной устойчивости значительны, оправдывая инвестиции. Миграция включала сложные этапы, включая перемещение дисков и Pod, реорганизацию разделов и настройку. Бережливое планирование и исполнение команды обеспечили нулевой простой и целостность данных на протяжении всего процесса. Опыт Etsy подчеркивает важность проектирования для устойчивости в критических службах. Благодаря многочисленной избыточности команда устранила риски, связанные с отказом одной зоны, и улучшила стабильность и доступность своего кластера Kafka. Многочисленная архитектура позволяет Etsy обрабатывать увеличение производственного трафика и ключевых пользовательских функций, таких как индексирование поиска, с уверенностью. Продолжающиеся усилия компании по оптимизации затрат демонстрируют приверженность балансировке между устойчивостью и финансовыми соображениями. Исследование случаев предоставляет ценные инсайты в сложности и стратегиях, связанных с миграцией и работой высокодоступного кластера Kafka в многочисленной облачной среде.
favicon
etsy.com
Adding Zonal Resiliency to Etsy’s Kafka Cluster: Part 1
Create attached notes ...