RSS Google 开发者博客 关注 使用 Gemini Embedding 2 构建:代理式多模态 RAG 及更广泛的应用 Google 已宣布 Gemini Embedding 2 正式可用,这是一个统一模型,可将文本、图像、视频、音频和文档映射到单一的语义空间。该模型允许开发者在单个请求中处理交错的多模态输入,显著提升了智能体 RAG、视觉搜索和内容审核等任务的性能。通过支持超过 100 种语言,并提供任务特定前缀和 Matryoshka 降维等功能,该模型为构建复杂 AI 智能体提供了高效且准确的基础。 Building with Gemini Embedding 2: Agentic multimodal RAG and beyond developers.googleblog.com