Gestion des ressources avec Ap... Note

Gestion des ressources avec Apache YuniKorn™ pour Apache Spark™ sur AWS EKS chez Pinterest

La plateforme de traitement par lots de Pinterest, Monarch, a été initialement conçue pour prendre en charge le nombre croissant de charges de travail Apache Spark et MapReduce à grande échelle. Cependant, l'entreprise a décidé de quitter Apache Hadoop et de passer à une plateforme de nouvelle génération basée sur Kubernetes (K8s) appelée Moka. Les principaux problèmes qui devaient être résolus étaient l'isolation des applications avec la conteneurisation, le support des GPU, l'effort de mise à jour de Hadoop et le soutien de la communauté Hadoop. Pour résoudre ces défis, Pinterest a décidé d'utiliser Apache YuniKorn, qui prend en charge les files d'attente hiérarchiques et peut planifier par application et par utilisateur. L'entreprise a également contribué plusieurs fonctionnalités et corrections à la communauté Apache YuniKorn, notamment le support de maxApplications, la prévention de la préemption et la correction d'un bug lors de la vérification de la marge de manœuvre. Pinterest continue de travailler avec la communauté pour enrichir la fonctionnalité et améliorer la fiabilité et l'efficacité d'Apache YuniKorn. L'entreprise travaille également sur une console de gestion des ressources complète et conçoit un service d'état qui exploite le support de diffusion d'événements.