Команда Google DeepMind представила Genie 3 — новую нейросеть для генерации интерактивных виртуальных миров. Модель позволяет создавать среды по текстовому описанию и исследовать их в режиме реального времени, как в простой видеоигре.
Ключевое улучшение Genie 3 — способность дольше сохранять целостность сгенерированного мира. Если в прошлой версии (Genie 2) взаимодействие длилось не более 20 секунд, то теперь пользователь может исследовать виртуальное пространство несколько минут без критических искажений. Система научилась «запоминать» объекты, временно уходящие из поля зрения камеры.
Нейросеть генерирует миры в разрешение 720p и с частотой кадров 24 fps. Модель поддерживает сложных сценарии среди которых: погодные эффекты, физика воды, динамическое освещение, экосистемы с флорой и фауной. Стилистика создаваемых миров может варьироваться от фотореалистичных локаций до анимационных и фэнтезийных.
Как это работает? Пользователь задает текстовый запрос (например, «исследование венецианских каналов с лодки» или «полет над вулканом»). Genie 3 генерирует среду, где можно перемещаться с помощью клавиатуры. Появилась функция «промпт-событий» — возможность менять мир в процессе: добавить дождь, персонажа или изменить ландшафт новым текстовым запросом.
Технология рассматривается не только как инструмент для развлечений, но и для обучения ИИ-агентов в симулированных условиях, образовательных проектов или прототипирования игровых локаций. На текущий момент Genie 3 демонстрирует прогресс в создании «устойчивых» нейрогенерируемых сред, где пользовательский опыт становится менее фрагментированным, чем у предшественников.