RSS Etsy 工程 | 代码作为工艺 Codeascraft在Etsy上是一个手工艺人合作项目,将计算机编程与传统手工艺结合在一起。该项目包括各种数字艺术品,由著名的程序员和艺术家共同创作,并将其转化为技术爱好者的小饰品。这些包括在玻璃烛台上印刷的二进制算法渲染、手工制作的二进制数字项链和封装在玻璃压纸器中的数字位肖像。Codeascraft专注于bridging技术和手工艺之间的差距,为代码爱好者提供独特的收藏品。 Etsy Engineering | Code as Craft etsy.com RSS codeascraft.com
利用对比强化学习塑造产品理解 Etsy 市场平台提供多样化的手工制品和独特商品,需要 nuanced 的理解才能实现有效的搜索与推荐。当前的产品信息虽然丰富,但往往是非结构化的,难以被机器学习模型充分利用。核心挑战在于弥合原始数据与定义每件商品吸引力的复杂细节之间的差距。解决方案采用强化学习方法和对比信号。该方法利用买家互动数据,微调大语言模型(LLM),生成强调区分性特征的简洁商品摘要。通过训练模型根据买家选择优先关注特定细节,从而提升相关性预测。模型在搜索交互数据上进行训练,对能够突出促使买家选择某一商品列表而非其他列表的特征的摘要给予奖励。这种强化学习驱动模型生成能够提升搜索相关性指标的摘要。人工评估和定量离线测试表明,这些摘要质量高,并对下游模型产生积极影响,提升了模型性能。该方法侧重于基于买家行为来理解商品,而非依赖僵化的定义,从而反映卖家的创造力。增强的商品理解最终帮助买家发现符合其偏好的商品,从而改善购物体验。生成的简洁摘要突出了区分相似商品列表的关键特征。该项目在展示重要商品细节方面表现出强大能力,相较于仅使用简单文本特征(如关键词)而言效果显著。 Shaping Product Understanding with Contrastive Reinforcement Learning etsy.com
用 LLM 构建 Etsy 买家画像 Etsy 利用大型语言模型 (LLM),根据浏览和购买历史创建详细的匿名买家画像。这些画像捕捉细微的兴趣和购物意图,从而为平台上近 9000 万买家增强个性化体验。 技术实现包括检索用户活动数据,然后提示 LLM 解释这些数据以生成画像。为了使这一过程具有可扩展性和成本效益,Etsy 优化了数据源,减少了输入令牌量,增加了批处理大小,并采用了并行处理。 这些优化大幅缩短了买家画像生成时间和成本。生成的买家画像随后被用于通过查询重写和精细化筛选按钮来个性化搜索体验。查询重写通过预测的兴趣来丰富用户搜索,而精细化筛选按钮则根据用户偏好提供可点击的过滤器。 Etsy 通过点击率和转化率提升等指标来衡量这种个性化的成功。他们还通过根据用户活动动态刷新画像并检测兴趣漂移来保持画像的准确性。 未来的工作包括通过尝试继承画像来解决新用户的“冷启动”问题。最终,Etsy 旨在改善发现,并为每位购物者创造更直观的搜索体验。 Building Etsy Buyer Profiles with LLMs etsy.com
上下文工程案例研究:Etsy 专属问答 本帖探讨了使用大型语言模型(LLM)进行 Etsy 人工智能辅助入门的提示工程。主要关注点是 LLM 生成答案的真实性和可靠性,特别是关于 Etsy 特定问题的答案。研究考察了两个用例:内部旅行和娱乐(T&E)政策问题和外部 Etsy 卖家社区论坛问题。对于 T&E 政策,LLM 正确回答了大约 86% 的问题,但剩下的 14% 包含事实错误或误导性陈述,称为“幻觉”。技术,如指示 LLM 承认不确定性或解释其推理,被发现可以减少这些幻觉。在 Etsy 社区论坛中,具有更多异构数据的准确性下降到约 72%。LLM 在查询与参考文档的措辞相匹配时表现更好。研究还强调了即使提供了额外上下文也无法解决某些复杂问题的限制。请求源代码片段被确定为标志潜在 LLM 幻觉的一种方法。总之,提示工程显示出 hứ,但需要小心设计以确保可靠的 AI 辅助入门和信息检索。 Context engineering case studies: Etsy-specific question answering etsy.com