Manejo de la limitación de red... Nota

Manejo de la limitación de red con AWS EC2 en Pinterest

Pinterest, un motor de búsqueda visual, funciona en AWS y utiliza instancias de Amazon EC2 para su flota de cómputo. La empresa identificó un desafío significativo en la gestión de su infraestructura EC2, particularmente para sus sistemas de almacenamiento online, debido a la falta de información clara sobre el rendimiento de la red de EC2 y su impacto en la fiabilidad y el rendimiento de la aplicación. Para abordar esto, Pinterest desarrolló un sistema de monitorización del rendimiento de la red para su flota de EC2 e implementó técnicas para gestionar los picos de tráfico de red, asegurando un rendimiento de red fiable para las cargas de trabajo de servicio online críticas. La empresa experimentó problemas con el servicio de secuencias de usuario, lo que impulsó importantes mejoras en el compromiso del usuario, pero provocó latencia en el servicio y tiempos de espera de la aplicación. Durante una migración de instancias EC2, Pinterest observó una degradación significativa del rendimiento en muchos clústeres, lo que provocó tiempos de espera de la aplicación. La empresa descubrió que las instancias EC2 estaban experimentando limitación de la red debido a micropicos que excedían el límite de la red. Para hacer más transparente el comportamiento de la limitación de la red de EC2, Pinterest actualizó sus instancias para acceder a contadores sin procesar en una instancia EC2 utilizando herramientas como ethtool. La empresa modificó su agente interno de recopilación de métricas para raspar estos contadores e ingresarlos en su almacenamiento de métricas. Al implementar estas métricas ENA en toda su flota de EC2, Pinterest obtuvo una visibilidad sin precedentes del modelado del tráfico de AWS e implementó varias optimizaciones para mitigar la limitación de la red. La empresa también exploró técnicas para manejar los picos de tráfico de red, incluyendo la limitación de velocidad de S3 de grano fino, la optimización de copias de seguridad de datos y la compresión de red.
CdXz5zHNQW_DGfWhUSLvs.jpeg