Google объединила генерацию видео, звука и картинок в одном сервисе

Компания Google анонсировала набор инструментов для генерации мультимедийного контента, включая видео, изображения и музыку. Главная новинка — модель Veo 3, которая создаёт ролики с синхронизированным звуком. В отличие от аналогов, алгоритм самостоятельно подбирает аудиодорожку: диалоги, шумы или музыку, анализируя визуальную часть. Например, если в кадре идёт дождь, зритель услышит стук капель без дополнительных команд.

Ещё одна модель, Imagen 4, генерирует изображения в разрешении 2K — от гиперреалистичных снимков до абстракций. Для работы со звуком добавлен Music AI Sandbox, который позволяет микшировать треки по текстовым запросам. Все эти инструменты объединены в сервис Flow, где пользователи могут комбинировать видео, картинки и текстовые сценарии, редактировать ракурсы камеры или добавлять новые сцены.

Особый акцент Google сделала на безопасности: все материалы помечаются водяными знаками SynthID, чтобы отличать их от реальных записей. Компания также сотрудничает с кинематографистами и музыкантами, чтобы адаптировать ИИ-инструменты для профессиональных задач. Однако не все рады инновациям: по данным Гильдии аниматоров Голливуда, к 2026 году автоматизация может сократить до 100 тысяч рабочих мест в креативных индустриях США.

Пока Flow доступен только в США. Базовая подписка (Google AI Pro), включающая 100 генераций оценена в $20 (около 1 606 рублей) в месяц. По словам разработчиков, сервис ориентирован как на профессионалов, так и на новичков — например, в нём есть библиотека примеров (Flow TV), где можно подсмотреть техники создания роликов. Пока Google не раскрывает, на каких данных обучалась модель, что вызывает вопросы у сообщества. Тем не менее, это первый шаг к тому, чтобы превратить генеративный ИИ из эксперимента в рабочий инструмент для авторов.

⌨️ Вчера ИИ от Илона Маска Grok сошёл с ума и начал везде писать о «геноциде белой расы в ЮАР»
-1
Комментарии 1