RSS Блог разработчиков Android

API запросов ML Kit: разблокировка индивидуальных опытов Gemini Nano на устройстве

Генеративный ИИ Android на устройстве достиг значительного рубежа с выпуском Alpha ML Kit GenAI Prompt API. Этот новый API позволяет разработчикам отправлять запросы на естественном языке и в многомодальном режиме в Gemini Nano, предлагая большую гибкость и контроль. Партнеры, такие как Kakao, уже используют этот API для создания инновационных опытов. Prompt API выходит за рамки предварительно созданных функций, позволяя создавать пользовательские, специфичные для приложения случаи использования генеративного ИИ. Он использует Gemini Nano для локальной обработки данных, обеспечивая возможность работы в автономном режиме и повышенную конфиденциальность пользователей. Ключевые случаи использования включают понимание изображений для классификации, интеллектуальное сканирование документов и преобразование данных для пользовательских интерфейсов. Разработчики также могут использовать его для контент-пrompting, анализа отзывов и извлечения информации из электронных писем. Реализация Prompt API требует минимального кода, позволяя разработчикам создавать пользовательские подсказки и задавать параметры генерации. В настоящее время API работает лучше всего на устройствах Pixel 10 с Gemini Nano nano-v3, который имеет общую архитектуру с Gemma 3n. Этот общий фундамент облегчает разработчикам прототипирование, и они также могут экспериментировать с Gemma 3n локально или через Google AI Studio. Разработчики могут найти подробные рекомендации по реализации и образцы на GitHub.
favicon
android-developers.googleblog.com
ML Kit’s Prompt API: Unlock Custom On-Device Gemini Nano Experiences
Create attached notes ...