Строительство с Gemini Embeddi... Заметка

Строительство с Gemini Embedding 2: Агентный мультимодальный RAG и дальше

Google объявила о общедоступности Gemini Embedding 2, унифицированной модели, которая сопоставляет текст, изображения, видео, аудио и документы в единое семантическое пространство. Эта модель позволяет разработчикам обрабатывать чередующиеся многомодальные входные данные в одном запросе, значительно улучшая производительность задач, таких как агентный RAG, визуальный поиск и модерация контента. Поддерживая более 100 языков и предлагая функции, такие как префиксы, специфичные для задач, и уменьшение размерности Матрёшка, модель обеспечивает высокоэффективную и точную основу для построения сложных ИИ-агентов.