Histoires RSS par Pinterest Engineering sur Medium - TheNote.app

Histoires RSS par Pinterest Engineering sur Medium
Suivre

L'ingénierie Pinterest, présentée sur Medium, offre un aperçu en coulisses des innovations technologiques qui alimentent la plateforme de découverte visuelle populaire. Grâce à des articles approfondis, les ingénieurs partagent leurs réflexions sur leur travail sur la scalabilité, l'apprentissage automatique, l'infrastructure de données et bien plus encore. La publication met en avant la culture d'ingénierie de Pinterest, en mettant l'accent sur la collaboration, l'expérimentation et la passion pour résoudre les problèmes complexes. Les lecteurs peuvent explorer des sujets tels que la construction de systèmes de recommandation, l'optimisation de la fonctionnalité de recherche et le développement d'outils d'analyse de données. Le contenu offre des perspectives précieuses pour les ingénieurs et les amateurs de technologie intéressés par les complexités d'une plateforme à grande échelle comme Pinterest. Que ce soit en plongeant dans les défis de la reconnaissance d'images ou en suivant l'évolution de leur infrastructure, l'ingénierie Pinterest sur Medium offre un regard fascinant sur le côté technique d'un site web aimé.

Stories by Pinterest Engineering on Medium medium.com

RSS Hunter • 22 août 2024

Fil de notes

Traitement des données de nouvelle génération à grande échelle chez Pinterest avec Moka (Partie 2 sur 2)

Pinterest développe Moka, une plateforme de traitement de données de nouvelle génération, pour remplacer son ancien système basé sur Hadoop. Cette plateforme est déployée sur AWS Elastic Kubernetes Service (EKS) dans quatre environnements : test, dev, staging et production. Terraform, complété par des modules AWS personnalisés et des graphiques Helm, gère les déploiements de clusters EKS. Un composant essentiel de Moka est son infrastructure de journalisation, qui utilise Fluent Bit pour collecter et exporter les journaux des plans de contrôle EKS, des applications Spark et des pods système vers Amazon S3. Fluent Bit est configuré pour regrouper les journaux des applications Spark par un identifiant de tâche unique et pour analyser les journaux YuniKorn afin d'obtenir des résumés de l'utilisation des ressources. Pour l'observabilité, Pinterest utilise un framework compatible avec Prometheus pour collecter des métriques. Ils ont développé un sidecar personnalisé, kubemetricsexporter, pour relier leur système Statsboard existant basé sur TSDB aux métriques Prometheus. L'OpenTelemetry Collector est utilisé pour recevoir, traiter et exporter les données de télémétrie, avec un pipeline spécifique configuré pour les métriques Prometheus. Cette infrastructure robuste vise à garantir un traitement des données efficace et fiable à grande échelle pour Pinterest.

Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 2 of 2) medium.com

RSS Hunter • 10 sept. 2025

Expérience du développeur chez Pinterest : Le parcours vers PinConsole

Pinterest a rencontré des défis en matière de vélocité d'ingénierie en raison de la complexité technologique croissante à mesure que sa base d'utilisateurs augmentait. L'entreprise a reconnu que sa stratégie d'adoption d'outils décentralisés créait des goulets d'étranglement et un paysage écrasant pour les nouveaux ingénieurs. Pour y remédier, Pinterest a décidé de réimaginer son expérience développeur en construisant une Plateforme Développeur Interne appelée PinConsole. PinConsole est un portail développeur unifié construit sur la plateforme open-source Backstage. Cette approche basée sur une plateforme vise à créer une couche d'abstraction cohérente, permettant aux ingénieurs de se concentrer sur la logique métier plutôt que sur l'infrastructure. Après avoir évalué diverses solutions, Pinterest a choisi Backstage pour son forte adoption par la communauté, son architecture de plugins extensible et son développement actif. PinConsole s'intègre aux systèmes d'authentification internes de Pinterest et à LDAP pour un modèle d'entité unifié. L'architecture utilise des bases de données PostgreSQL pour le stockage des données et applique le système de conception Gestalt de Pinterest pour la cohérence de l'interface utilisateur. Un composant clé est le plugin PinCompute, une intégration Kubernetes personnalisée qui simplifie la gestion des charges de travail à l'aide d'abstractions spécifiques à Pinterest. Des widgets de page d'accueil personnalisés, comme l'intégration GitHub, améliorent encore l'expérience développeur en réduisant le changement de contexte et en fournissant des informations pertinentes.

Developer Experience at Pinterest: The Journey to PinConsole medium.com

RSS Hunter • 22 août 2025

Déboguer l'échec une fois sur un million : Migration de l'infrastructure de recherche de Pinterest vers Kubernetes

L'infrastructure de recherche de Pinterest, Manas, a été migrée vers Kubernetes, mais un problème de performance a été découvert où une requête de recherche sur un million prenait 100 fois plus de temps que d'habitude. Le problème a été étudié et il a été constaté qu'un processus de surveillance, cAdvisor, était à l'origine du problème. cAdvisor scannait la table des pages entière toutes les 30 secondes pour calculer le nombre total d'octets de mémoire référencés par un processus, ce qui provoquait des conflits avec le traitement de feuilles intensif en mémoire de Manas. Cela entraînait des pics de latence dans les requêtes de recherche. L'enquête a impliqué le profilage des systèmes de recherche, le débogage des problèmes de performance, les fonctionnalités du noyau Linux et la gestion de la mémoire. La cause profonde a été identifiée comme étant l'estimation de la taille de l'ensemble de travail (WSS) de cAdvisor, qui était activée par défaut et provoquait la contention de la mémoire. Le problème a été résolu en désactivant l'estimation du WSS de cAdvisor pour tous les nœuds PinCompute. Cette correction a été une étape majeure pour la plateforme Kubernetes de Pinterest, permettant à d'autres services en ligne d'être déplacés vers la plateforme. L'enquête a souligné l'importance de l'isolation des ressources, de la réduction de l'espace de problèmes et de l'utilisation de stratégies de débogage en boîte noire. L'expérience a également montré que, parfois, une solution suffisamment bonne est suffisante, et qu'il n'est pas nécessaire de trouver une solution exacte pour avancer.

Debugging the One-in-a-Million Failure: Migrating Pinterest’s Search Infrastructure to Kubernetes medium.com

RSS Hunter • 16 juil. 2025

Traitement de données de nouvelle génération à grande échelle sur Pinterest avec Moka (1ère partie sur 2)

L’équipe d’ingénierie des données de Pinterest est en train de créer une nouvelle plateforme de traitement de données à grande échelle pour remplacer sa plateforme actuelle basée sur Hadoop, Monarch. L’équipe a exploré les systèmes basés sur Kubernetes en remplacement en raison de leur popularité croissante et de leur adoption croissante dans la communauté du Big Data. La nouvelle plateforme devait répondre à certains critères, notamment une prise en charge étendue des conteneurs, l’exécution de la fourche Spark personnalisée de Pinterest et une réduction des coûts d’exploitation et de maintenance. L’équipe a effectué une évaluation complète de l’exécution de Spark sur diverses plates-formes et s’est tournée vers les frameworks axés sur Kubernetes en raison de leurs avantages, notamment l’isolation et la sécurité basées sur les conteneurs, la facilité de déploiement et les frameworks intégrés. Kubernetes offre une prise en charge plus précise de la gestion et du déploiement des conteneurs que les autres systèmes, mais ne prend pas en charge la gestion, le stockage et le traitement des données. Le modèle de déploiement actuel de l’équipe dans Hadoop est lourd, et l’équipe s’oriente vers une approche plus simple à l’aide de Terraform, d’images de conteneurs et de Helm. La nouvelle plateforme s’appuiera sur Kubernetes et EKS pour remplacer Monarch, ce qui présente plusieurs défis, notamment l’intégration d’EKS dans l’environnement Pinterest existant et la recherche de remplacements pour les composants Hadoop. L’équipe a créé une nouvelle plateforme, Moka, capable de traiter des charges de travail Spark par lots qui n’accèdent qu’aux données non sensibles, et ajoutera plus de fonctionnalités à l’avenir. La conception initiale de haut niveau de Moka comprend un système capable de traiter des charges de travail Spark par lots, avec des tâches soumises et traitées par une série de composants, notamment Spinner, Archer et Spark Operator. L’équipe fournira plus de détails sur les principaux aspects de leur plateforme axés sur les applications dans la prochaine partie de leur série de blogs.

Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 1 of 2) medium.com

RSS Hunter • 11 juil. 2025

Étendre l'infrastructure d'apprentissage automatique de Pinterest avec Ray : du entraînement aux pipelines d'apprentissage automatique de bout en bout

Chez Pinterest, les ingénieurs en apprentissage automatique (ML) rencontrent des défis pour optimiser le développement de fonctionnalités, les stratégies d'échantillonnage et l'expérimentation d'étiquettes en raison de pipelines de données lents, de coûteuses itérations de fonctionnalités et d'une utilisation inefficace des ressources de calcul. Pour relever ces défis, Pinterest a étendu les capacités de Ray au-delà de la formation pour inclure le développement de fonctionnalités, l'échantillonnage et la modélisation d'étiquettes. L'infrastructure ML traditionnelle était contrainte par des pipelines de données lents, des itérations de fonctionnalités coûteuses et une utilisation inefficace des ressources de calcul. Pinterest a introduit une pile d'infrastructure ML native Ray, se concentrant sur quatre améliorations majeures : la création d'une API de pipeline de données native Ray, la jointure de données efficace avec les jointures de bucket Iceberg, la persistance des données pour l'itération efficace et les optimisations de données Ray pour les charges de travail importantes. Le nouveau workflow ML alimenté par Ray réduit les temps d'itération ML de 10 fois tout en réduisant significativement les coûts d'infrastructure. L'API de pipeline de données native Ray permet le développement de fonctionnalités, l'échantillonnage et les transformations d'étiquettes nativement dans Ray, éliminant la nécessité de retours Spark. Les jointures de bucket Iceberg permettent des jointures de fonctionnalités rapides et efficaces à partir de différentes sources sans précalculer de grandes tables. La persistance des données permet une itération efficace en mettant en cache les fonctionnalités transformées et en les réutilisant lorsque cela est possible. Les optimisations de données Ray ont atteint une accélération de 2-3 fois sur différents pipelines, et le nouveau workflow a débloqué une infrastructure ML plus scalable, efficace et économique chez Pinterest.

Scaling Pinterest ML Infrastructure with Ray: From Training to End-to-End ML Pipelines medium.com

RSS Hunter • 24 juin 2025

Déverrouiller la récupération efficace des annonces publicitaires : les plus proches voisins approximatifs hors ligne dans les annonces Pinterest

Pinterest utilise les voisins les plus proches approximatifs (ANN) en ligne pour la récupération de publicités, mais l'ANN hors ligne est également précieuse pour le traitement de données à grande échelle et les opérations économiques. L'ANN hors ligne précalcule les candidats hors ligne, idéal pour les scénarios avec un débit élevé et des réponses de requête à faible latence, ainsi que des requêtes statiques. Pinterest a réussi à appliquer l'ANN en ligne, mais fait face à des défis pour étendre son inventaire de annonces. La migration de l'algorithme de petit monde navigable hiérarchique (HNSW) à l'algorithme de fichier inversé (IVF) permet d'avoir un index plus large, mais augmente les coûts. L'ANN hors ligne bénéficie de ressources computationnelles abondantes et de tolérance à la latence, efficace pour les générateurs de candidats avec des contextes de requête statiques. La principale différence entre les approches en ligne et hors ligne est le moment de la recherche d'ANN. L'ANN hors ligne a des avantages, notamment l'efficacité coût et l'extensibilité, mais également des inconvénients, notamment les limitations en temps réel et les voisins fixes. Pinterest a évalué la récupération basée sur l'ANN hors ligne, notamment les annonces d'articles similaires et l'intégration d'éléments visuels. L'ANN hors ligne a montré de meilleures performances d'engagement et de conversion, et développe actuellement sa propre plateforme et son propre framework d'ANN hors ligne pour les avancées à venir.

Unlocking Efficient Ad Retrieval: Offline Approximate Nearest Neighbors in Pinterest Ads medium.com

RSS Hunter • 12 juin 2025

Personnalisation de niveau supérieur : comment 16 000+ actions utilisateur à vie renforcent les suggestions de Pinterest

Le fil d'accueil de Pinterest est crucial pour l'engagement des utilisateurs et la découverte, et il utilise un processus en deux étapes pour classer les épingles en fonction des intérêts des utilisateurs et de la pertinence des épingles personnalisées. Le modèle Pinnability utilise un réseau de neurones pour consommer divers signaux d'épingle, de contexte et d'utilisateur, mais il a des limitations pour modéliser le comportement des utilisateurs tout au long de leur vie. Le modèle TransActV2 répond à ces défis en exploitant de longues séquences, en intégrant une fonction de perte d'action suivante et en employant des solutions de déploiement évolutives. TransActV2 peut modéliser jusqu'à 16 000 actions d'utilisateur, intègre des fonctionnalités d'action explicites et stocke les actions sans perte à l'aide de quantification int8. Le modèle utilise un réseau multi-tête, point-à-point multi-tâche sur une pile large et profonde, et introduit une fonction de perte d'action suivante pour améliorer la prévision des actions d'utilisateur. La fonction NAL challenge le modèle pour prédire non seulement la probabilité d'engagement mais également ce que l'utilisateur fera ensuite. Le modèle obtient des améliorations dans les métriques hors ligne et en ligne, notamment une augmentation de 13,31% du top-3 repin et une augmentation de 6,35% du repin. L'ingénierie à grande échelle du modèle permet une serving et un déploiement efficaces, réalisant une réduction de 75-81% de la latence d'exécution du modèle et une réduction de 103-338x de la latence d'inférence de bout en bout. L'impact réel du monde réel de TransActV2 est massif, avec des millions d'engagements plus significatifs et des améliorations importantes de l'expérience utilisateur.

Next-Level Personalization: How 16k+ Lifelong User Actions Supercharge Pinterest’s Recommendations medium.com

RSS Hunter • 6 juin 2025

Migration et mise à l'échelle automatisées des clusters Hadoop™

L'infrastructure de données de Pinterest utilise Hadoop YARN sur AWS avec des groupes de mise à l'échelle automatique (ASG) pour traiter de grandes quantités de données. L'entreprise utilise Terraform pour créer et gérer des grappes, mais la mise à l'échelle descendante (réduction de taille) est un processus complexe qui nécessite des étapes manuelles. Pour simplifier ce processus, Pinterest a introduit le Hadoop Control Center (HCC), qui permet une mise à l'échelle automatique ascendante et descendante des grappes. Avant HCC, la mise à l'échelle descendante impliquait un processus fastidieux et sujet à erreurs consistant à sélectionner les nœuds à décommissionner, à les ajouter à des fichiers d'exclusion, puis à les terminer. HCC rationalise ce processus en permettant aux utilisateurs de spécifier la taille souhaitée de l'ASG, et l'outil gère le reste. HCC intègre également d'autres outils utiles pour la gestion des grappes, notamment l'affichage de l'état des nœuds, la génération de rapports sur les applications YARN et l'affichage des détails de sous-réseau et de groupe de sécurité. L'architecture de HCC se compose d'un nœud gestionnaire et de nœuds de travail, le nœud gestionnaire agissant comme un intermédiaire et un cache. Le serveur d'exploitation Hadoop (HOS) est le cœur de HCC, qui effectue les tâches lourdes de mise à jour du cache JMX, de maintenance des connexions de tissu et de mise à jour des fichiers d'exclusion. HCC interroge périodiquement et consolide les données JMX pour prendre des décisions sur ce qu'il faut faire, et il gère le processus de décommissionnement des nœuds.

Automated Migration and Scaling of Hadoop™ Clusters medium.com

RSS Hunter • 5 juin 2025

Adopter Docs-as-Code chez Pinterest

Les sondages internes de Pinterest auprès des développeurs ont révélé que la documentation technique est un point de friction majeur, les problèmes se résumant à la qualité et à la découvrabilité. Les solutions traditionnelles, telles que les doc-a-thons et les appels passionnés des hauts responsables, n'ont pas produit d'améliorations durables. En 2021, Pinterest a décidé d'essayer une nouvelle approche, en explorant différentes stratégies pour améliorer les outils et les processus de documentation, en mettant l'accent sur la stratégie "docs-as-code" (documentation en tant que code). Cette initiative, appelée PDocs, visait à élever la qualité de la documentation technique et à transformer la culture de la documentation chez Pinterest. La philosophie "docs-as-code" implique de rédiger la documentation en utilisant les mêmes processus que le code, notamment l'utilisation de langages de balisage, du contrôle de source, des outils de revue de code et des générateurs de sites statiques. En adoptant cette stratégie, Pinterest visait à résoudre les problèmes de documentation, à encourager les bonnes pratiques de documentation, le contrôle de la qualité et la découvrabilité. PDocs, un générateur de sites statiques personnalisé, a été développé pour colocaliser automatiquement les projets de documentation provenant de divers chemins de fichiers et référentiels, générant ainsi un seul site de documentation centralisé. PDocs permet une expérience de développement où les ingénieurs peuvent déposer un simple fichier de configuration et un fichier Markdown dans n'importe quel référentiel, et le faire apparaître sur le site de documentation centralisé une fois fusionné. L'interface utilisateur de PDocs a été conçue pour être centrée sur le projet, avec des fonctionnalités telles que la mise en favoris, les éléments récemment consultés et un paramètre "publié" ou "brouillon" pour maintenir la confiance des lecteurs.

Adopting Docs-as-Code at Pinterest medium.com

RSS Hunter • 3 juin 2025

Personnalisation plus saine avec les sondages

Pinterest est une plateforme unique où les utilisateurs, appelés Pinners, viennent chercher l'inspiration et des idées pour divers aspects de leur vie. L'objectif de la plateforme est d'offrir une expérience personnalisée, en montrant aux utilisateurs un contenu pertinent par rapport à leurs intérêts et à leurs recherches. L'approche de Pinterest en matière de personnalisation diffère de celle des autres plateformes, car elle privilégie un temps de qualité plutôt que le temps passé sur la plateforme. L'entreprise estime qu'un équilibre entre différentes approches du classement du contenu est nécessaire, intégrant des signaux d'engagement explicites, des directives communautaires et une personnalisation basée sur des sondages. Pinterest utilise des sondages pour recueillir les commentaires des utilisateurs et créer une expérience plus saine et plus inspirante. Les sondages de la plateforme sont conçus pour être rigoureux et efficaces, avec une équipe d'experts veillant à ce qu'ils soient bien conçus et utiles. Les sondages ont joué un rôle déterminant dans l'aide apportée à Pinterest pour créer une expérience positive et inspirante pour les utilisateurs, des recherches récentes montrant que la plateforme est un chef de file du secteur en termes d'impact sur le bien-être des utilisateurs. L'approche de Pinterest en matière de personnalisation est guidée par les principes de l'Inspired Internet Pledge (Engagement pour un Internet Inspirant), qui appelle les entreprises à donner la priorité au bien-être des utilisateurs et à créer une expérience internet plus saine. En utilisant des sondages et en donnant la priorité au bien-être des utilisateurs, Pinterest prouve qu'il est possible de créer une expérience en ligne plus sûre et plus saine. Globalement, l'approche unique de Pinterest en matière de personnalisation et son engagement envers le bien-être des utilisateurs le distinguent des autres plateformes de médias sociaux.

Healthier Personalization with Surveys medium.com

RSS Hunter • 30 mai 2025

Modernisation de l'étape de pré-classement du fil d'accueil domestique

Le système de recommandation de flux d'accueil de Pinterest a adopté une conception à plusieurs étapes, et a atteint un jalon important avec une couche de pré-classement sophistiquée qui a amélioré les métriques commerciales. La conception initiale avait des limitations, notamment les efforts de déploiement, les défis de ré-entraînement automatique des modèles et une architecture à deux tours qui ne pouvait pas apprendre les interactions entre les éléments de manière efficace. L'équipe a apporté des améliorations fondamentales pour moderniser la couche de pré-classement, notamment une nouvelle conception de système, un pipeline de journalisation et une architecture de service. La nouvelle conception comprend un sous-composant de niveau de requête et un sous-composant de niveau d'élément qui sont entraînés conjointement et découplés pendant le service. L'équipe a également mis en place un pipeline de journalisation de funnel précoce pour distinguer le pré-classement du classement et pour apporter des données non biaisées dans l'entraînement de l'architecture comprend une architecture racine-feuille pour atténuer les surcoûts de CPU et de mémoire. L'équipe a également adopté la distillation de modèle pour mieux aligner le modèle de pré-classement avec le classeur L2. Les expériences en ligne ont montré des gains significatifs d'engagement, et l'équipe a également travaillé sur la mise en place d'un framework de ré-entraînement pour exploiter les données d'engagement fraîches. L'équipe continue de travailler sur les innovations de modèle, la sélection de données, l'amélioration de l'architecture de modèle, l'exploration des pertes et l'optimisation du service.

Modernizing Home Feed Pre-Ranking Stage medium.com

RSS Hunter • 29 mai 2025

Comment Pinterest accélère les itérations de fonctionnalités ML via une mise en remplissage efficace

Chez Pinterest, la mission est d'inspirer les utilisateurs à créer une vie qu'ils aiment, ce qui repose sur des modèles de recommandation et de publicités de pointe formés à partir de dizaines de pétaoctets de données. Ces modèles entraînent des recommandations personnalisées, montrant aux utilisateurs du contenu qui résonne avec leurs intérêts. Expérimenter avec des fonctionnalités est une tâche courante, et la première étape consiste à intégrer de nouvelles fonctionnalités dans le jeu de données d'apprentissage. La méthode la plus directe pour intégrer des fonctionnalités est par enregistrement en avant, mais cette méthode pose des défis tels que coût élevé en jours calendaires, temps de développement élevé, manque d'isolement, gaspillage de ressources et instabilité. Le backfill de fonctionnalités est une alternative à l'enregistrement en avant couramment utilisée pour répondre à ces défis. Dans cet article de blog, les auteurs explorent comment ils ont créé leur solution de backfill de fonctionnalités, en exploitant diverses techniques pour réduire les coûts et le temps d'itération jusqu'à 90 fois. Les auteurs ont développé une solution de backfill initiale utilisant Spark pour matérialiser les fonctionnalités dans leurs tables d'apprentissage, qui fonctionne comme un DAG Airflow réutilisable déclenché par les ingénieurs ML sur demande. Cependant, cette solution pose des défis tels que l'absence de backfills concurrents, coût de calcul élevé et gestion manuelle des partitions. Pour répondre à ces défis, les auteurs ont développé une version v2, adoptant une approche de backfill en deux étapes, qui rationalise le processus en deux étapes clés : la mise en scène des fonctionnalités et la promotion des fonctionnalités.

How Pinterest Accelerates ML Feature Iterations via Effective Backfill medium.com

RSS Hunter • 19 mai 2025

Amélioration de la scalabilité de 500 fois pour le calcul des métriques d'expérience dans un cadre dynamique unifié

La plateforme d'expérimentation de Pinterest, Helium, exécute des expériences quotidiennes générant des connaissances pour les décisions de produits et les stratégies commerciales. Cependant, à mesure que l'échelle de l'expérimentation a augmenté, des défis sont apparus, notamment des retards dans l'ingestion de données en amont, des difficultés pour combler les lacunes dans les métriques et des problèmes de scalabilité fréquents. Pour relever ces défis, Pinterest a développé le Cadre Dynamique Unifié (UDF), une solution évolutivité et résiliente qui a transformé la façon dont les métriques d'expérimentation sont calculées. Le UDF prend en charge 100 fois plus de métriques et est conçu pour évoluer jusqu'à 500 fois dans le futur, accélérant la livraison des métriques et réduisant les efforts d'ingénierie de mois à des jours. Le cadre atteint une standardisation du traitement des métriques, déchargeant les défis d'infrastructure et les complexités de création de pipeline. Le UDF répond aux dépendances en amont, à la complexité de backfill et aux problèmes de scalabilité, permettant une expérimentation et une innovation plus rapides. Le cadre a amélioré la vitesse de développement, la flexibilité, la scalabilité, la vitesse et la fiabilité, stimulant l'innovation et les résultats commerciaux. La standardisation du calcul des métriques à travers la plateforme d'expérimentation a conduit à des améliorations considérables, permettant l'expérimentation et apportant de la valeur aux utilisateurs. Le UDF a révolutionné le calcul des métriques d'expérimentation chez Pinterest, et son impact continuera de croître dans le futur.

500X Scalability of Experiment Metric Computing with Unified Dynamic Framework medium.com

RSS Hunter • 13 mai 2025

Architecture de modèle Multi-gate-Mixture-of-Experts (MMoE) et distillation de connaissances dans les publicités...

L'architecture de modèle Multi-gate Mixture-of-Experts (MMoE) améliore la modélisation de l'engagement publicitaire en affectant dynamiquement des ressources à des sous-réseaux spécialisés (experts). Cela améliore l'efficacité, la généralisation et l'apprentissage multi-tâches par rapport aux modèles uniques. MMoE exploite des experts avec des architectures diverses comme DCNv2, MaskNet et FinalMLP, choisis de manière stratégique en fonction de la performance et du coût. Le modèle utilise également l'inférence de précision mixte et des couches de porte légères pour réduire les coûts d'infrastructure sans sacrifier les performances. La distillation de connaissances améliore encore le modèle en transférant les connaissances des modèles de production existants vers les nouveaux modèles. Cela atténue les écarts de performance causés par les périodes de rétention de données limitées et permet aux nouveaux modèles d'apprendre à partir de données historiques indisponibles. La distillation améliore significativement les métriques offline et online, surpassant le modèle de référence DCNv2. La technique est bénéfique lors des scénarios d'entraînement par lots et de réentraînement de modèles, tels que les mises à jour de fonctionnalités. Cependant, la distillation est supprimée lors de l'entraînement incrémental pour éviter la sur-apprentissage. L'approche combinée de MMoE et de distillation de connaissances conduit à des améliorations substantielles de la qualité de mise en correspondance des annonces et de l'expérience utilisateur. Cela se traduit par des recommandations plus pertinentes et une amélioration de l'engagement utilisateur sur la plateforme.

Multi-gate-Mixture-of-Experts (MMoE) model architecture and knowledge distillation in Ads… medium.com

RSS Hunter • 24 avr. 2025

Migrer 3,7 millions de lignes de code Flow vers TypeScript

Pinterest a migré 3,7 millions de lignes de code de Flow vers TypeScript en huit mois, ce qui a entraîné une meilleure sécurité de type, une expérience développeur améliorée et une amélioration du recrutement. L'entreprise avait initialement choisi Flow au-dessus de TypeScript en 2016 en raison de son adoption progressive et de son intégration sans heurt avec React. Cependant, lorsque l'industrie a adopté TypeScript comme standard pour la vérification de type JavaScript, Pinterest a décidé d'adopter ce dernier en raison de son meilleur soutien communautaire, de ses fonctionnalités de langage et de la disponibilité de talents. La migration a été réalisée en utilisant une approche "big bang", divisant le processus en trois phases : configuration, conversion et intégration. La phase de configuration a consisté à configurer TypeScript et @typescript-eslint, tandis que la phase de conversion a impliqué la migration des dépendances, l'exécution de codemods et la suppression des erreurs ESLint. La phase d'intégration s'est concentrée sur l'adaptation des systèmes existants pour fonctionner dans le nouvel environnement TypeScript. L'entreprise a écrit un script pour automatiser l'ensemble du processus, minimisant les conflits de fusion et les interventions manuelles. Après avoir validé la migration par des tests automatisés quotidiens, plusieurs rounds de tests manuels et une analyse statique byte-for-byte, Pinterest a réussi à déployer la branche TypeScript. L'entreprise a appris beaucoup de la communauté open-source et a contribué au codemod flow-to-typescript de Stripe. L'expérience de Pinterest sert de leçon précieuse pour les autres entreprises qui envisagent une migration similaire.

Migrating 3.7 Million Lines of Flow Code to TypeScript medium.com

RSS Hunter • 16 avr. 2025

Gestion de la limitation du débit réseau avec AWS EC2 chez Pinterest

Pinterest, un moteur de recherche visuel, fonctionne sur AWS et utilise des instances Amazon EC2 pour son parc informatique. L'entreprise a identifié un défi majeur dans la gestion de son infrastructure EC2, notamment pour ses systèmes de stockage en ligne, en raison d'un manque de visibilité claire sur les performances réseau d'EC2 et son impact sur la fiabilité et les performances de l'application. Pour résoudre ce problème, Pinterest a développé une surveillance des performances réseau de son parc EC2 et a mis en œuvre des techniques pour gérer les pics de trafic réseau, garantissant ainsi des performances réseau fiables pour les charges de travail critiques de service en ligne. L'entreprise a rencontré des problèmes avec le service de séquences utilisateur, qui a généré des gains importants en termes d'engagement utilisateur, mais a entraîné une latence de service et des délais d'expiration de l'application. Lors d'une migration d'instances EC2, Pinterest a constaté une dégradation significative des performances sur de nombreux clusters, entraînant des délais d'expiration de l'application. L'entreprise a découvert que les instances EC2 subissaient une limitation du débit réseau due à des micro-pics dépassant l'allocation réseau. Pour rendre le comportement de limitation du débit réseau EC2 plus transparent, Pinterest a mis à niveau ses instances pour accéder aux compteurs bruts sur une instance EC2 à l'aide d'outils tels qu'ethtool. L'entreprise a modifié son agent de collecte de mesures internes pour récupérer ces compteurs et les intégrer à son stockage de mesures. En déployant ces mesures ENA sur l'ensemble de son parc EC2, Pinterest a obtenu une visibilité sans précédent sur la gestion du trafic AWS et a mis en œuvre diverses optimisations pour atténuer la limitation du débit réseau. L'entreprise a également exploré des techniques pour gérer les pics de trafic réseau, notamment la limitation de débit S3 granulaire, l'optimisation des sauvegardes de données et la compression réseau.

Handling Network Throttling with AWS EC2 at Pinterest medium.com

RSS Hunter • 7 avr. 2025

Amélioration de la pertinence de la recherche sur Pinterest en utilisant de grands modèles de langage

La recherche Pinterest est une surface clé où les utilisateurs peuvent découvrir du contenu inspirant qui correspond à leurs besoins d'information, et la pertinence de la recherche mesure à quel point les résultats de la recherche correspondent à la requête de recherche. Pour améliorer le modèle de pertinence de la recherche, une directive à 5 niveaux est utilisée pour mesurer la pertinence entre les requêtes et les épingles. Un modèle de langage cross-encoder est utilisé pour prédire la pertinence d'une épingle par rapport à une requête, ainsi que le texte de l'épingle, et la tâche est formulée comme un problème de classification multiclasse. Le modèle est affiné en utilisant des données annotées par des humains, en minimisant la perte d'entropie croisée.Pour représenter chaque épingle, un ensemble varié de caractéristiques textuelles est utilisé, notamment les titres et les descriptions des épingles, les légendes d'images synthétiques, les jetons de requête à forte interaction, les titres de planches créés par les utilisateurs et les titres et les descriptions de liens. Cependant, le classificateur basé sur le modèle de langage cross-encoder LLM est difficile à mettre à l'échelle pour la recherche Pinterest en raison de considérations de latence et de coût en temps réel. Par conséquent, la distillation des connaissances est utilisée pour distiller le modèle d'enseignant LLM en un modèle d'apprentissage léger.Le modèle d'apprentissage utilise des caractéristiques au niveau de la requête, des caractéristiques au niveau de l'épingle et des caractéristiques d'interaction requête-épingle pour prédire des scores de pertinence à 5 échelles. La distillation des connaissances et l'apprentissage semi-supervisé sont utilisés pour former le modèle d'apprentissage, qui utilise efficacement de grandes quantités de données initialement non étiquetées et étend les données à un large éventail de langues du monde entier.Les expériences hors ligne démontrent l'efficacité de chaque décision de modélisation, notamment la comparaison des modèles de langage, l'importance de l'enrichissement des caractéristiques textuelles et la mise à l'échelle des étiquettes de formation grâce à la distillation. Les résultats en ligne montrent une amélioration de +2,18 % de la pertinence de l'alimentation de recherche, telle que mesurée par nDCG@20, et une augmentation significative des taux de satisfaction de la recherche à l'échelle mondiale.Le pipeline de modélisation de la pertinence proposé généralise efficacement à travers les langues non rencontrées pendant la formation, et le modèle d'enseignant LLM multilingue généralise à travers les langues non vues. Les travaux futurs exploreront l'intégration de LLM servables, de modèles multimodaux vision-langage et de stratégies d'apprentissage actif pour mettre à l'échelle dynamiquement et améliorer la qualité des données de formation.

Improving Pinterest Search Relevance Using Large Language Models medium.com

RSS Hunter • 4 avr. 2025

Simplifiez le suivi des conversions Pinterest avec des paquets NPM

API de conversion de Pinterest et étiquette sont essentiels pour optimiser les campagnes publicitaires et analyser le ROI, mais leur mise en œuvre peut être complexe. Deux nouveaux packages NPM, pinterest-conversions-server et pinterest-conversions-client, simplifient ce processus pour les développeurs. Le package serveur facilite le suivi des événements côté serveur à l'aide de l'API de conversion, en prenant en charge des fonctions comme les données utilisateur hachées. Le package client permet un suivi direct et simple côté client via l'étiquette Pinterest, directement à partir du navigateur. Les deux packages offrent des fonctionnalités d'événements de test pour la validation avant le déploiement en production. Ils proposent des interfaces propres et réutilisables pour une intégration aisée dans les projets existants. L'installation est simple à l'aide de npm, et des exemples d'utilisation sont inclus dans la documentation. Les données sensibles must être correctement hachées, et le consentement légal pour la collecte des données doit être obtenu. Les deux packages sont open-source sous la licence MIT et accueillent les contributions de la communauté. Ces outils simplifient le suivi des conversions, améliorent l'optimisation des campagnes et le ROI. Pour en savoir plus sur l'ingénierie de Pinterest, consultez leur blog, laboratoires et carrières.

Simplify Pinterest Conversion Tracking with NPM Packages medium.com

RSS Hunter • 23 déc. 2024

Comment Pinterest utilise Honeycomb pour améliorer l'observabilité CI et améliorer la stabilité des builds CI

L'équipe d'infrastructure mobile de Pinterest utilise Honeycomb pour améliorer l'observabilité et les performances dans leurs constructions mobiles et les workflows d'intégration continue (CI). Honeycomb fournit des informations essentielles sur les workflows CI, permettant à l'équipe de s'attaquer proactivement aux problèmes et d'optimiser les performances. L'outil de construction de requête intuitif et la performance rapide de Honeycomb permettent à l'équipe de se plonger dans les détails granulaires et de logger des segments spécifiques dans les scripts de construction. La vue de trace de Honeycomb offre une vision d'ensemble des processus CI, identifiant les causes racines et économisant du temps et des efforts. L'équipe utilise également Honeycomb pour la catégorisation des erreurs, fournissant des informations plus approfondies sur les échecs de construction et rationalisant les devoirs de garde. Les applications de Honeycomb s'étendent au-delà des métriques CI, avec des équipes qui l'utilisent pour obtenir des informations en temps réel sur les données de performance et adapter l'observabilité à leurs besoins. L'équipe améliore continuellement les processus de construction avec Honeycomb comme partenaire crucial, explorant de nouveaux cas d'utilisation et élargissant les pratiques d'observabilité basées sur les données.

How Pinterest Leverages Honeycomb to Enhance CI Observability and Improve CI Build Stability medium.com

RSS Hunter • 3 déc. 2024

Capture des modifications de données chez Pinterest

Pinterest a mis en œuvre une solution générique de capture de données de modification (CDC) pour résoudre les incohérences dans les solutions existantes et isolées. Ce nouveau système utilise Red Hat Debezium et est conçu pour la fiabilité, la scalabilité et la faible latence. L'architecture sépare le plan de contrôle, qui gère l'état et la configuration du système, du plan de données, qui traite les modifications et les envoie à Kafka. Kafka stocke les données CDC, que les utilisateurs peuvent ensuite consommer. La mise en œuvre a surmonté plusieurs défis, notamment des problèmes de scalabilité, des délais d'équilibrage et des tâches en double. Les solutions ont impliqué le démarrage, la limitation de débit, l'ajustement des configurations de délai et la mise à niveau de Kafka. Les améliorations ont abouti à une performance stable du système et à une réduction significative du temps de récupération en cas de défaillance. Les plans futurs incluent l'amélioration de la scalabilité, la mise en œuvre de la reprise après sinistre à l'aide de la CDC et la création d'un système d'ingestion de base de données en temps quasi réel. Le succès du projet a impliqué des contributions de plusieurs équipes de Pinterest. Enfin, l'article de blog inclut un avertissement concernant les marques déposées.

Change Data Capture at Pinterest medium.com

RSS Hunter • 18 nov. 2024

Gestion des ressources avec Apache YuniKorn™ pour Apache Spark™ sur AWS EKS chez Pinterest

La plateforme de traitement par lots de Pinterest, Monarch, a été initialement conçue pour prendre en charge le nombre croissant de charges de travail Apache Spark et MapReduce à grande échelle. Cependant, l'entreprise a décidé de quitter Apache Hadoop et de passer à une plateforme de nouvelle génération basée sur Kubernetes (K8s) appelée Moka. Les principaux problèmes qui devaient être résolus étaient l'isolation des applications avec la conteneurisation, le support des GPU, l'effort de mise à jour de Hadoop et le soutien de la communauté Hadoop. Pour résoudre ces défis, Pinterest a décidé d'utiliser Apache YuniKorn, qui prend en charge les files d'attente hiérarchiques et peut planifier par application et par utilisateur. L'entreprise a également contribué plusieurs fonctionnalités et corrections à la communauté Apache YuniKorn, notamment le support de maxApplications, la prévention de la préemption et la correction d'un bug lors de la vérification de la marge de manœuvre. Pinterest continue de travailler avec la communauté pour enrichir la fonctionnalité et améliorer la fiabilité et l'efficacité d'Apache YuniKorn. L'entreprise travaille également sur une console de gestion des ressources complète et conçoit un service d'état qui exploite le support de diffusion d'événements.

Resource Management with Apache YuniKorn™ for Apache Spark™ on AWS EKS at Pinterest medium.com

RSS Hunter • 23 oct. 2024

Inférence Ray Batch sur Pinterest (Partie 3)

Alex Wang, Lei Pan, Raymond Lee, Saurabh Vishwas Joshi et Chia-Wei Chen ont discuté de l'utilisation de Ray en tant que cadre de traitement de données de dernière étape chez Pinterest. Ils ont décrit comment Ray a été intégré dans leur infrastructure ML et comment il a résolu des problèmes commerciaux critiques. Dans cet article, ils ont discuté d'un deuxième type d'application populaire de Ray chez Pinterest : l'inférence par lots hors ligne de modèles ML. Ils ont également partagé comment leur implémentation a pu offrir une augmentation de débit de 4,5 fois et des économies de coûts de 30 fois.

Ray Batch Inference at Pinterest (Part 3) medium.com

RSS Hunter • 11 oct. 2024

Mise en cache de caractéristiques pour les systèmes de recommandation avec Cachelib

Chez Pinterest, nous exploitons un grand système d'inférence en apprentissage automatique en ligne à grande échelle, où la mise en cache des caractéristiques joue un rôle critique pour atteindre l'efficacité optimale. Nous avons décidé d'adopter le projet Cachelib de Meta Open Source et d'étendre ses capacités pour construire une cache de caractéristiques flexible et à haute performance. Notre système repose fortement sur un système de mise en cache pour livrer des caractéristiques ML de manière efficace, et la position de la cache dans notre système est cruciale. Nous avons évolué notre architecture de système tandis que notre plateforme d'inférence ML passait de CPU à GPU. Nous avons expérimenté trois architectures de cache différentes : Cache DRAM fragmentée, Cache hybride DRAM + NVM sur un seul nœud et Nœuds de cache et d'inférence séparés. Nous avons également mis en place un pipeline pour réchauffer la cache froide sur les nouveaux nœuds avant qu'ils ne commencent à servir le trafic, qui consiste à enregistrer les demandes de caractéristiques, à télécharger les demandes enregistrées sur S3 et à répéter les demandes sur les nouveaux nœuds.

Feature Caching for Recommender Systems w/ Cachelib medium.com

RSS Hunter • 20 sept. 2024

Stockage en plusieurs étages Pinterest pour Apache Kafka : une approche déconnectée du courtier

Apache Kafka est devenu une solution PubSub omniprésente, gérant des pétaoctets de données à Pinterest. Pour répondre aux besoins de stockage croissants, le stockage en plusieurs étages (Tiered Storage) a émergé comme un modèle de conception qui déplace les données des disques de broker coûteux vers des systèmes de stockage à distance plus abordables.Le stockage en plusieurs étages natif dans Kafka 3.6.0+ lie étroitement la fonctionnalité au processus de broker, limitant la flexibilité.L'implémentation de stockage en plusieurs étages déconnecté de Pinterest sépare le stockage du calcul, offrant des avantages tels que la réduction des coûts, l'optimisation des ressources et une adoption plus facile.L'approche déconnectée emploie un chargeur de segment qui charge les segments de journal finalisés dans le stockage à distance, un consommateur de stockage en plusieurs étages pour la consommation de données, et un système de stockage à distance avec des coûts de stockage par unité plus faibles.Le chargeur de segment surveille les systèmes de fichiers des brokers pour détecter les segments finalisés, détecte les changements de leadership via ZooKeeper (ou KRaft dans les versions plus récentes de Kafka), et gère la tolérance aux pannes pour assurer la continuité des données.Le consommateur de stockage en plusieurs étages lit les données à la fois sur le disque local du broker et dans le stockage à distance, réduisant le coût de service.Cette implémentation déconnectée a déplacé environ 200 TB de données quotidiennes des disques de broker vers le stockage d'objets plus abordable depuis mai 2024.Elle offre une flexibilité dans l'adoption du stockage en plusieurs étages et les mises à jour de fonctionnalités, sans affecter les performances du broker.L'implémentation open-source de la solution de stockage en plusieurs étages déconnecté de Pinterest pour Apache Kafka est maintenant disponible.

Pinterest Tiered Storage for Apache Kafka®️: A Broker-Decoupled Approach medium.com

RSS Hunter • 17 sept. 2024

Rencontrez les mentors de stage de l'année de Pinterest

Le programme de stages de Pinterest associe les stagiaires à des mentors pour favoriser le développement de carrière. Les mentors guident les stagiaires tout au long de leur parcours professionnel, leur offrant soutien et expertise.Irena Lee, ingénieure logicielle, est devenue mentor pour donner en retour la mentorat qu'elle a reçu, offrant une expérience d'intégration positive à son stagiaire.Ricardo Casilimas, ingénieur iOS, cherche à reproduire son expérience de stage transformante en donnant confiance et des compétences à ses stagiaires.Lily Liu, scientifique des données senior, valorise la mentorat car elle permet de remettre en question ses propres hypothèses et d'acquérir de nouvelles perspectives de la part de ses mentés.Sujay Khandagale, ingénieur en apprentissage automatique, considère la mentorat comme récompensante et croyant qu'elle permet une croissance personnelle et professionnelle.David Xue, ingénieur en apprentissage automatique, attribue à son mentor de stage le mérite de l'avoir émancipé et apprécie de mentoriser les stagiaires car cela permet une appréntissage mutuel.Le moment le plus mémorable pour Lee fut de se connecter avec son stagiaire en personne, renforçant leur lien de mentorat.Casilimas fut impressionné par la croissance de son stagiaire et sa détermination à apprendre de ses erreurs.Liu a pris plaisir à voir le progrès de son stagiaire et sa capacité à naviguer les défis de manière indépendante.Khandagale a trouvé récompensant de guider son stagiaire tout au long du processus de construction et de déploiement d'un modèle d'apprentissage automatique.Xue valorise les moments où ses stagiaires le surprennent avec leurs idées et l'exécution de leurs projets.

Meet Pinterest’s Internship Mentors of the Year medium.com

RSS Hunter • 10 sept. 2024

Amélioration de l'efficacité de la base de données de séries chronologiques Goku chez Pinterest (Partie - 3)

Goku, la base de données de série chronologique de Pinterest, se compose de sous-composants : Goku Short Term (GokuS), Goku Long Term (GokuL), Goku Compactor et Goku Root.Afin de réduire les coûts, Pinterest a mis en œuvre deux fonctionnalités pour l'équipe Observabilité : L'espace de noms de métriques permet des configurations de stockage flexibles pour différentes familles de métriques, tandis que la fourniture des métriques d'écriture lourdes en tête aide à identifier les métriques à bloquer, réduisant les données stockées dans GokuS.Les changements architecturaux dans GokuS, Compactor et Ingestor visent à réduire l'empreinte des ressources. Les améliorations de l'indexation ont optimisé le stockage des noms de métriques, réduisant significativement la consommation de mémoire de processus.Les améliorations de la compaction ont utilisé l'encodage de dictionnaire pour représenter les noms de métriques, ce qui a entraîné une réduction de l'utilisation de la mémoire.L'analyse de la mémoire de processus et l'évaluation du matériel des machines du cluster ont aidé à déterminer les types d'instances appropriés.La consommation de mémoire pour les noms de métriques dans GokuS a été réduite d'environ 9 Go par hôte après les améliorations de l'indexation.L'équipe Observabilité a réduit le nombre de séries chronologiques stockées dans GokuS de 37% en utilisant les fonctionnalités de Goku.L'utilisation du disque sur les hôtes GokuL a été réduite d'environ 27%.Ces optimisations permettent à Pinterest de stocker et de traiter de vastes quantités de données de métriques de manière rentable.

Improving Efficiency Of Goku Time Series Database at Pinterest (Part — 3) medium.com

RSS Hunter • 9 sept. 2024

Amélioration des performances vidéo ABR sur Pinterest

Pinterest a amélioré les performances vidéo grâce à la diffusion en flux continu adaptatif (ABR), en utilisant le streaming en direct HTTP (HLS) et la diffusion adaptative dynamique sur HTTP (DASH).Pour réduire la latence de démarrage, Pinterest a intégré des fichiers de manifeste dans les réponses API, éliminant les aller-retours réseau multiples pour récupérer les manifestes.MemCache a été ajouté pour réduire la charge sur les points de terminaison API pour la récupération des manifestes, ce qui a également réduit la latence.La personnalisation du processus de chargement des manifestes dans les lecteurs (AVPlayer et ExoPlayer) a permis d'accéder directement aux informations de manifeste, contournant les téléchargements inutiles.Les plateformes iOS et Android ont mis en œuvre ces solutions, entraînant des améliorations significatives de la latence de démarrage et de l'engagement des utilisateurs.En manipulant le chargement des manifestes, les clients peuvent ajuster le contrôle de la qualité vidéo, limitant les renditions de débit pour les surfaces d'interface utilisateur spécifiques.Ce projet a été mené par Liang Ma et Sterling Li, dont l'expertise technique a joué un rôle crucial dans son succès.Cette amélioration complète les initiatives d'ingénierie de Pinterest, qui visent à améliorer l'expérience utilisateur et à stimuler l'engagement.Pour en savoir plus, visitez le blog d'ingénierie de Pinterest, Pinterest Labs et la page des offres d'emploi pour les rôles ouverts.

Improving ABR Video Performance at Pinterest medium.com

RSS Hunter • 30 août 2024

Réaménagement des systèmes de diffusion des annonces de Pinterest sans temps d'arrêt (partie 2)

AdMixer, un système de gestion des publicités reconstruit, privilégie l'extensibilité, la séparation des préoccupations, la mise en œuvre sécurisée par conception et la vitesse de développement. Le cadre d'exécution de graphiques Apex permet la modularité et la simplification de la dépréciation, tandis que le modèle de données écrit-une-fois garantit l'intégrité des données et la sécurité des threads. Les structures de données Thrift de Mohawk ont été remplacées par des types Java immuables pour éviter les problèmes de mutation de données. La migration vers AdMixer a impliqué trois étapes : l'expansion des fonctionnalités abstraites, l'opération parallèle et la vérification de la correction. La validation basée sur les valeurs, la validation basée sur les métriques et les expériences A/B en direct ont été utilisées pour garantir la précision sans affecter le trafic de production. AdMixer améliore significativement la maintenabilité, la scalabilité et la correction, permettant des améliorations futures et assurant une livraison d'annonces fiable.

Redesigning Pinterest’s Ad Serving Systems with Zero Downtime (part 2) medium.com

RSS Hunter • 20 août 2024

Intégration en tant qu'ingénieur web @ Pinterest

Pendant leur première semaine à Pinterest, Rebecca et Jordan ont vécu un processus d'intégration qui équilibrait la formation technique avec les connections sociales. Le programme Basecamp de Pinterest a fourni une solide base d'ingénierie, tandis que les curriculums spécifiques à l'équipe ont adapté l'apprentissage à leurs rôles d'ingénieurs web. Ils ont tous deux participé à une formation basée sur des projets, Rebecca améliorant l'expérience vidéo des épingles et Jordan menant une audit des performances sur les surfaces de recherche. Le processus d'intégration a mis l'accent sur la collaboration, avec des synchronisations hebdomadaires et des canaux de communication clairs. Rebecca et Jordan ont identifié des opportunités pour simplifier l'accès à l'information et optimiser la pertinence de la formation. L'engagement de l'entreprise en faveur d'une mentalité de croissance et des mécanismes de rétroaction a garanti une amélioration continue de l'expérience d'intégration. D'ici la fin de leurs huit semaines d'intégration, ils se sentaient confiants et prêts à contribuer efficacement à l'équipe. Le processus structuré et le soutien des gestionnaires et des collègues ont créé une expérience d'intégration positive qui les a préparés au succès.

Onboarding as a Web Engineer @ Pinterest medium.com

RSS Hunter • 13 août 2024

NEP: Système de notification et pertinence

NEP (Processeur d'événements de notification) est un système de notification en temps réel développé par Pinterest. Il améliore l'engagement des utilisateurs grâce à des notifications personnalisées basées sur divers facteurs. NEP utilise l'apprentissage automatique pour déterminer le contenu, les destinataires, les canaux et le moment optimal pour les notifications. Ses composants de modélisation clés se concentrent sur ce qu'il faut envoyer, à qui, par quel canal, à quel moment et comment prioriser le contenu. NEP introduit une approche de génération de candidats quotidiens pour les événements de notification, et emploie un modèle multi-tête (NEP ranker) pour prédire les probabilités d'engagement des utilisateurs. La composante Policy prend des décisions d'envoi de notifications en fonction des scores d'utilité et des seuils, qui sont automatiquement ajustés à l'aide d'un contrôleur PID pour aligner le volume d'envoi. La mise en œuvre de NEP a entraîné des améliorations significatives dans les métriques d'engagement des e-mails et des push, ainsi que dans la croissance du nombre d'utilisateurs actifs hebdomadaires (WAU). Le système est servi en temps réel à l'aide d'un cluster GPU et la mise en service de modèles à faible précision est prévue pour une optimisation future. NEP démontre l'importance des notifications dans la rétention des utilisateurs et met en évidence les avantages de l'utilisation de l'apprentissage automatique pour des stratégies d'engagement personnalisées et opportunes.

NEP: Notification System and Relevance medium.com

RSS Hunter • 8 août 2024

Livraison d'analyses plus rapides sur Pinterest

Pinterest a migré ses données d'analytiques en temps réel vers StarRocks pour répondre à l'augmentation de l'échelle et des exigences. StarRocks offre une prise en charge standard SQL, des jointures et une ingestion native, éliminant les dépendances externes. La migration vers StarRocks a entraîné une réduction de 50% de la latence p90 et une augmentation de trois fois l'efficacité coût-performance. Le processus d'ingestion des données a été simplifié, atteignant une fraîcheur des données de seulement 10 secondes. La compatibilité MySQL de StarRocks a facilité l'intégration avec les outils existants. Les défis de Partner Insights, un outil d'analytiques en temps réel pour les annonceurs, comprennent des requêtes volumineuses et complexes. L'architecture interne de Partner Insights utilisant StarRocks comprend des nœuds frontend et backend, ainsi qu'Archmage, un service Pinterest qui simplifie le déploiement et les opérations. Archmage utilise le pooling de connexions pour minimiser le temps de configuration des connexions JDBC. Les optimisations futures incluent l'exploitation du cache de requête et des vues matérialisées pour améliorer encore les performances. Pinterest explore des opportunités de collaboration avec la communauté StarRocks pour contribuer à la croissance et à l'évolution du projet.

Delivering Faster Analytics at Pinterest medium.com

RSS Hunter • 31 juil. 2024

L'adoption de TiDB chez Pinterest

Pour remplacer HBase, Pinterest a évalué plus de 10 technologies de stockage de données en fonction de critères tels que la fiabilité, les performances, la fonctionnalité et le soutien de la communauté. Après une sélection initiale, trois options sont restées : TiDB, YugabyteDB et DB-X. Les tests de trafic d'ombre avec des charges de travail de production ont révélé la stabilité et les performances soutenues de TiDB. Les tests de fiabilité ont confirmé la résilience de TiDB et l'absence de défauts fondamentaux. La mise en œuvre de TiDB à Pinterest utilise Teletraan, un système maison, mais une migration vers EKS est prévue à mesure que le soutien Kubernetes mûrit. La réplication trois volets et les réplicas en lecture seule réduisent les coûts de stockage par rapport aux six réplicas d'HBase. TiDB est actuellement déployé dans une seule région AWS avec trois réplicas dans des AZ différentes pour la tolérance aux pannes. Les communications sont protégées en utilisant TLS mutuel et validation CNAME, avec Envoy comme proxy vers la couche SQL. Pinterest explore les configurations multi-régions et l'élimination d'Envoy pour améliorer le contrôle des connexions.

TiDB Adoption at Pinterest medium.com

RSS Hunter • 19 juil. 2024

Comprendre les données de construction de dévitesse avec Honeycomb

Develocity, un outil d'optimisation de la construction, est intégré avec Honeycomb pour une observabilité accrue à Pinterest. Cette intégration permet d'obtenir des informations plus approfondies sur les données de construction, y compris l'identification des valeurs aberrantes et la comparaison des types de machines. Le langage de requête robuste de Honeycomb permet des requêtes plus complexes, telles que le regroupement des temps de construction par utilisateur et l'identification des utilisateurs avec des JDK non conformes. BubbleUp, une fonctionnalité de Honeycomb, aide à identifier les constructions lentes et les plugins supplémentaires qui entraînent des coûts de configuration et d'exécution. Le traitement rapide de Honeycomb garantit des workflows fluides, fournissant des résultats en moins d'une seconde. Pinterest utilise l'API de Develocity pour accéder aux données de construction, qui sont ensuite traitées et envoyées à Honeycomb à l'aide de libhoney. L'intégration de Develocity avec Honeycomb a fourni à l'équipe des constructions mobiles de Pinterest des informations précieuses, leur permettant d'optimiser les performances de construction et d'améliorer les processus de développement. Les autres utilisateurs de Develocity sont encouragés à considérer cette approche pour maximiser le potentiel de leurs données de construction.

Understanding Develocity Build Data with Honeycomb medium.com

RSS Hunter • 15 juil. 2024

Création de Pinterest Canvas, un modèle de base d'image à partir de texte

Le modèle de texte-à-image Pinterest Canvas est entraîné sur plus de 1,5 milliard de paires texte-image de haute qualité pour générer des images visuellement attrayantes. Le modèle de base est affiné pour générer des arrière-plans photoréalistes pour les produits, en utilisant un processus d'entraînement en deux étapes qui implique le remplissage et préserve les limites des objets. Les images de conditionnement sont utilisées pour guider le processus de génération, avec l'intégration de l'embedding visuel unifié (UVE) qui s'est avérée particulièrement efficace pour influencer les sorties. Le modèle est amélioré avec IP-Adapter pour traiter des prompts d'image supplémentaires, ce qui lui permet de générer des arrière-plans dans des styles visuels spécifiques. Les améliorations futures incluent la mise à niveau vers une architecture de diffusion de transformateur, l'exploration d'approches de masquage souple et l'intégration d'embeddings visuels optimisés pour Pinterest pour une meilleure condition textuelle. Pinterest Canvas permet de visualiser les produits dans de nouveaux contextes et d'améliorer les images et les produits existants sur la plateforme.

Building Pinterest Canvas, a text-to-image foundation model medium.com

RSS Hunter • 10 juil. 2024

Détection de régression des performances web (Partie 3 sur 3)

Pinterest priorise la lutte contre les régressions de performance, en utilisant des métriques d'utilisateur en temps réel pour surveiller et enquêter sur les problèmes. Les systèmes de détection proactifs comprennent des vérifications d'expériences A/B, qui déclenchent des alertes et des billets Jira pour les régressions significatives. Les tableaux de bord d'expériences fournissent des métriques de performance de premier ordre, tandis que des tableaux de bord supplémentaires permettent une investigation plus approfondie des chemins critiques. Lorsqu'une analyse détaillée est nécessaire, des métriques de débogage en temps réel peuvent être activées.Les vérifications de taille de bundle JS par différence identifient et empêchent les augmentations de taille de bundle qui pourraient causer des régressions de PWT. Ces vérifications ont réduit les régressions de production dues à des augmentations de taille de bundle à presque zéro. Les tests d'intégration de performance sont également exécutés par différence pour détecter les régressions de manière synthétique avant qu'elles ne parviennent aux utilisateurs.Les enseignements clés tirés de ces outils comprennent l'importance de la surveillance en temps réel des utilisateurs, des systèmes proactifs automatisés et des alertes de régression claires et actionnables. Ces systèmes permettent une détection précoce, isolent les causes racines, permettent une auto-suffisance en matière de performance et évoluent avec la croissance de l'entreprise. Ils ont considérablement réduit les régressions de performance, amélioré la vitesse interne et renforcé l'expérience utilisateur.

Web Performance Regression Detection (Part 3 of 3) medium.com

RSS Hunter • 28 juin 2024

Infrastructure Ray à Pinterest

En 2023, Pinterest a commencé à intégrer Ray dans son infrastructure, rencontrant des défis tels que l'accès limité à l'API K8s, la journalisation et les métriques éphémères, et les exigences d'authentification. Pour répondre à ces défis, Pinterest a développé un contrôleur de cluster Ray et une passerelle API pour gérer la mise en place de clusters Ray et traiter l'authentification. Ils ont également créé une interface utilisateur dédiée pour la journalisation et les métriques persistantes, et ont intégré avec leur base de données chronologique maison (Goku) pour la visualisation des métriques. Pinterest propose plusieurs interfaces de développement pour les applications Ray, y compris Jupyter, Dev server et Spinner workflow. Des frameworks de test unitaire et d'intégration sont offerts pour le développement et le test des applications. L'analyse de données hors ligne est rendue possible en exportant les métriques de cluster au format de données volumineuses pour l'analyse hors ligne. L'infrastructure Ray de Pinterest intègre les meilleures pratiques de Ray et répond aux besoins uniques de l'entreprise, y compris la sécurité, les paramètres de trafic et les intégrations de service. La plateforme offre un contrôle centralisé sur la gestion des clusters Ray et simplifie le processus pour les utilisateurs.

Ray Infrastructure at Pinterest medium.com

RSS Hunter • 17 juin 2024

Réinventer les systèmes de diffusion publicitaire de Pinterest sans temps d'arrêt

La plateforme de diffusion publicitaire de Pinterest, Mohawk, avait accumulé une complexité et une dette technique significatives au cours de ses huit ans d'existence. Pour résoudre ces problèmes et poser les bases pour une croissance future, l'équipe Ads Infra a initié une réécriture complète du système à la fin de 2021.La réécriture visait à améliorer l'extensibilité, la séparation des préoccupations et l'intégrité des données, tout en renforçant la vitesse de développement et la sécurité. Après trois mois de recherche et d'évaluation, l'équipe a décidé de reconstruire le service en utilisant Java et le framework d'exécution de graphique Apex.Une décision clé dans la conception était d'utiliser Apex pour organiser le code en graphes acycliques dirigés (DAG), où chaque nœud représentait une unité logique commerciale cohérente. Cela a permis la modularité et l'extensibilité.L'équipe a également développé un modèle de données innovant transmis à travers le graphique pour garantir l'exécution sécurisée et l'intégrité des données.Le service redessiné, nommé AdMixer, est entré en production en milieu de 2023 sans aucun temps d'arrêt significatif. Il a permis une innovation produit plus rapide, une satisfaction accrue des développeurs et des économies de coûts d'infrastructure.La réécriture a impliqué une collaboration significative et des contributions de plus de 280 ingénieurs. L'équipe a attribué son succès à une planification soignée, à l'adhésion aux principes de conception d'ingénierie et à un engagement en faveur de la qualité et de la sécurité.Le nouveau service AdMixer a fourni une solide base pour le business publicitaire de Pinterest et est bien positionné pour soutenir la croissance et l'innovation futures.

Redesigning Pinterest’s Ad Serving Systems with Zero Downtime medium.com

RSS Hunter • 7 juin 2024