RSS MacRumors: Новости и слухи о компьютерах Mac - Первая страница

Новый набор данных Apple с искусственным интеллектом нацелен на улучшение моделей редактирования фотографий

Исследователи Apple представили Pico-Banana-400K, набор данных из 400 000 изображений, предназначенный для улучшения редактирования фотографий с помощью ИИ на основе текстовых подсказок. Набор данных призван устранить текущий пробел в обучении ИИ для редактирования изображений, который был ограничен неадекватными данными для обучения. Новый набор данных Apple содержит изображения, организованные в 35 различных типов редактирования в восьми категориях, включая базовые настройки и сложные преобразования. Каждое изображение оценивалось с использованием системы контроля качества Apple на базе ИИ и Google Gemini-2.5-Pro. Набор данных включает три специализированных подмножества для базового обучения, пар предпочтений и многоходовых последовательностей. Подмножества содержат 258 000 примеров одиночного редактирования, 56 000 пар предпочтений и 72 000 многоходовых последовательностей. Apple создала набор данных, используя модель редактирования изображений Google Gemini-2.5-Flash, которая была выпущена несколько месяцев назад. Однако исследование Apple выявило ограничения этой модели, особенно в таких точных задачах, как перемещение объектов или редактирование текста. Показатели успеха для этих задач были ниже 60%, в то время как глобальные изменения стиля удавались в 93% случаев. Ожидается, что выпуск Pico-Banana-400K улучшит производительность систем ИИ при редактировании фотографий на основе текстовых подсказок.
favicon
macrumors.com
Apple's New AI Dataset Aims to Improve Photo Editing Models
Изображение к статье: Новый набор данных Apple с искусственным интеллектом нацелен на улучшение моделей редактирования фотографий
Create attached notes ...