Julien Tayon : Le vrai coût et le code de l’analyse de l’intégralité de bluesky ATPROTO (francophone) en python
L'auteur remet en question l'idée selon laquelle l'exécution d'un serveur Bluesky est prohibitivement coûteuse et complexe. Il détaille son expérience de l'exécution d'un scan en temps réel de l'ensemble du réseau Bluesky depuis un modeste PC domestique. Ce bot, écrit en Python, consomme des ressources minimales : 25 % de CPU, moins d'un tiers de la bande passante domestique et seulement 640 Mo de mémoire. L'auteur affirme explicitement qu'il n'est pas nécessaire de dépenser 300 $ par mois pour exécuter un Bluesky AppView, comme d'autres le suggèrent. Il explique que, bien que les requêtes API intensives comme get_post soient soumises à des limitations de débit, la consultation du "firehose" (flux continu de données) lui-même est gratuite. Le bot se concentre sur les événements de publication (posts), qui représentent une plus petite fraction du trafic total du réseau. L'auteur aborde également le filtrage du spam et du contenu NSFW (Not Safe For Work, contenu inapproprié pour le travail), atteignant une efficacité élevée grâce à une liste noire basée sur les tags. Il donne un aperçu de son approche de codage, notamment l'utilisation du multiprocessing et d'une structure de base de données simple. Le projet intègre une interface web pour la classification du contenu et un module de détection du spam. Enfin, l'auteur encourage les autres à expérimenter avec l'API ATProto/Bluesky, soulignant que son "code jouet" démontre la faisabilité sur du matériel ordinaire.
get_postsoient soumises à des limitations de débit, la consultation du "firehose" (flux continu de données) lui-même est gratuite. Le bot se concentre sur les événements de publication (posts), qui représentent une plus petite fraction du trafic total du réseau. L'auteur aborde également le filtrage du spam et du contenu NSFW (Not Safe For Work, contenu inapproprié pour le travail), atteignant une efficacité élevée grâce à une liste noire basée sur les tags. Il donne un aperçu de son approche de codage, notamment l'utilisation du multiprocessing et d'une structure de base de données simple. Le projet intègre une interface web pour la classification du contenu et un module de détection du spam. Enfin, l'auteur encourage les autres à expérimenter avec l'API ATProto/Bluesky, soulignant que son "code jouet" démontre la faisabilité sur du matériel ordinaire.