RSS Fast Company

Почему 2026 год принадлежит мультимодальному ИИ

Текущее состояние ИИ в основном основано на тексте, когда пользователи взаимодействуют с чат-ботами, чтобы получить информацию, но это едва поверхностно касается того, что может сделать ИИ. Основные модели быстро становятся многомодальными, способными обрабатывать голос, визуальные и видео данные в режиме реального времени, но потребители не используют их в полной мере. Следующая волна внедрения ИИ будет сосредоточена на развитии за пределы статического текста в динамические, погружающие взаимодействия, что называется ИИ 2.0. Этот сдвиг позволит пользователям испытывать интеллект через звук, визуальные, движение и контекст реального времени, а не просто получать информацию быстрее. Внедрение ИИ достигло точки бифуркации, когда еженедельная база пользователей ChatGPT удвоилась в 2025 году, но большинство пользователей по-прежнему взаимодействуют с ИИ в основном через текстовые чат-боты. Потребители жаждут погружающихся опытов, как видно из их предпочтения платформам, созданным пользователями, таких как TikTok и YouTube, и они проводят больше времени на социальных видео-платформах, чем на традиционных СМИ. Индустрия признает разрыв между поведением потребителей и инструментами ИИ, и инвестиции делаются для его закрытия, с прогнозируемым фундаментальным сдвигом в том, как люди используют и создают с помощью ИИ. Многомодальный ИИ откроет погружающееся повествование, позволяя пользователям стать активными участниками и формировать свои переживания в реальном времени, а не просто потреблять контент, сгенерированный ИИ. Рост многомодального ИИ также позволит пользователям создавать свои собственные переживания, подобные тем, которые встречаются в игровой индустрии, и обеспечит более безопасную среду для более молодых пользователей, проектируя ограничители внутри структурированных, многомодальных миров. Когда ИИ становится более погружающимся и интерактивным, он изменит то, как пользователи взаимодействуют с технологиями, и победителями следующего цикла будут те, кто создает среды для погружения и исследования, а не просто строит инструменты для эффективности.
favicon
fastcompany.com
Why 2026 belongs to multimodal AI
Изображение к статье: Почему 2026 год принадлежит мультимодальному ИИ