RSS Блог Google AI
Подписаться
Одна картинка стоит тысячи (личных) слов: Иерархическое создание связных синтетических фотоальбомов
Дифференциальная конфиденциальность защищает отдельные данные, гарантируя, что результаты анализа не раскрывают конфиденциальную информацию. Создание частных синтетических наборов данных предлагает альтернативу приватизации всех аналитических методов. Этот подход использует генеративные модели искусственного интеллекта, такие как Gemini, для создания частного синтетического набора данных, представляющего исходные данные. Модель обучается с использованием методов дифференциальной приватности, что обеспечивает приватность и репрезентативность синтетических данных. Исследование направлено на создание синтетических фотоальбомов, преодоление ограничений простых типов данных. Метод переводит данные изображения в текст и обратно, поддерживая тематическую согласованность в альбомах. Иерархическая генерация, которая сначала подводит итоги альбома, а затем добавляет подписи к фотографиям, повышает согласованность и эффективность использования ресурсов. Этот промежуточный подход на основе текста имеет преимущества при описании изображений и фильтрации данных. Метод был протестирован на наборе данных YFCC100M, подтвердив его эффективность в создании подобных тем альбомов. Для оценки сходства использовались лиловые баллы описаний и анализ темы контента. Исследование демонстрирует способ распространения преимуществ частных синтетических данных на более сложные, структурированные данные. Это может стать мощным решением для обеспечения баланса между требованиями к данным и конфиденциальностью пользователей. Разработанный подход открывает возможности для развития искусственного интеллекта с сохранением конфиденциальности в различных важнейших отраслях.