Новый ИИ от Google превращает текст в трёхмерные игры
Google DeepMind анонсировала новую версию своей ИИ-модели Genie 2, которая способна преобразовывать текстовые описания в трёхмерные интерактивные игровые окружения. Эта разработка расширяет возможности первой версии, Genie, выпущенной в феврале 2024 года, которая генерировала двухмерные миры.
Genie 2 позволяет пользователям создавать сложные виртуальные пространства, описывая их текстом. ИИ отвечает за рендеринг окружения, а взаимодействие происходит через действия, выполняемые пользователем, — будь то движение мыши или нажатие клавиш. Генерация базируется на алгоритмах модели Imagen 3, которая синтезирует визуальные элементы по текстовым подсказкам.
Вторая версия получила существенные улучшения:
- Трёхмерная перспектива: поддерживаются виды от первого и третьего лица, а также изометрические ракурсы;
- Интерактивные сцены: возможно моделирование взаимодействий, включая лопание шаров, открытие дверей и взрывы;
- Физические эффекты: появились гравитация, отражения, динамика воды, дыма и освещения;
- Работа с NPC: добавлена анимация персонажей и взаимодействие с неигровыми объектами;
- Память об элементах: ИИ запоминает объекты вне поля зрения пользователя;
- Моделирование на основе фото: окружения теперь могут быть созданы с учётом реальных изображений.
На данный момент Genie 2 способна генерировать интерактивные сцены продолжительностью до одной минуты. Однако Google DeepMind подчёркивает, что технология находится на раннем этапе развития. Для её улучшения требуются значительные доработки в области взаимодействия агентов и создания более сложных миров.
Компания видит в Genie 2 инструмент для безопасной тренировки ИИ-агентов, а также платформу для создания уникальных цифровых сред, что может ускорить разработку игр и тестирование алгоритмов. Genie 2 — это шаг вперёд в интеграции ИИ в разработку интерактивных миров. Несмотря на текущие ограничения, технология демонстрирует потенциал для революции в игровой индустрии и обучении искусственных интеллектов.
-
Нейросеть научили генерировать CS:GO в реальном времени
-
Нейросеть Pika научилась снимать более реалистичные видео — вышла версия 1.5
-
Нейросеть Suno научилась менять жанр песен
-
Новая нейросеть для фотореалистичных изображений превосходит Midjourney. Вот на что она способна
-
Google показала прототип Project Mariner — ИИ-помощника для Chrome