RSS Python星球 关注 Julien Tayon:在 Python 中解析(法语)Bluesky ATPROTO 完整性的真实成本和代码 作者挑战了“运行 Bluesky 服务器成本高昂且复杂”的观点。他们详细介绍了自己用一台普通的家用电脑实时扫描整个 Bluesky 网络的经验。这个用 Python 编写的机器人消耗的资源很少:25% 的 CPU,不到三分之一的家庭带宽,以及仅 640MB 的内存。作者明确指出,人们不需要像其他人建议的那样,每月花费 300 美元来运行 Bluesky AppView。他们解释说,虽然像 get_post 这样密集的 API 请求受到速率限制,但扫描整个数据流(firehose)是免费的。这个机器人专注于帖子事件,而帖子事件仅占网络总流量的一小部分。作者还讨论了过滤垃圾信息和 NSFW 内容,并通过基于标签的黑名单实现了高效率。他们分享了他们的编码方法,包括使用多进程和一个简单的数据库结构。该项目包含一个用于内容分类的 Web 界面和一个垃圾信息检测模块。最后,作者鼓励其他人尝试 ATProto/Bluesky API,并强调他们的“玩具代码”证明了在普通硬件上实现的可行性。 Julien Tayon: The true cost and code of parsing the integrality of (french speaking) bluesky ATPROTO in python beauty-of-imagination.blogspot.com
get_post这样密集的 API 请求受到速率限制,但扫描整个数据流(firehose)是免费的。这个机器人专注于帖子事件,而帖子事件仅占网络总流量的一小部分。作者还讨论了过滤垃圾信息和 NSFW 内容,并通过基于标签的黑名单实现了高效率。他们分享了他们的编码方法,包括使用多进程和一个简单的数据库结构。该项目包含一个用于内容分类的 Web 界面和一个垃圾信息检测模块。最后,作者鼓励其他人尝试 ATProto/Bluesky API,并强调他们的“玩具代码”证明了在普通硬件上实现的可行性。