Новости Железо и технологии видео Google представила мультимодальный ИИ Gemini 2.0 с поддержкой видео и звука

Google представила мультимодальный ИИ Gemini 2.0 с поддержкой видео и звука

Arkadiy Andrienko

12 декабря 2024, 12:50

11 декабря Google анонсировала запуск новой модели искусственного интеллекта Gemini 2.0, которая обещает стать важным шагом в эволюции технологий ИИ. Gemini 2.0 представляет собой многорежимную систему, которая может обрабатывать изображения, видео и аудио, а также генерировать их. Новая модель значительно превосходит предшественницу 1.5 по скорости отклика и производительности, в два раза быстрее отвечая на запросы.

Одной из ключевых особенностей Gemini 2.0 является поддержка мультимодальности — возможность одновременно работать с текстом, изображениями и звуком. Модель может не только распознавать, но и создавать изображения, комбинируя их с текстовыми запросами. Это открывает новые перспективы для разработки ботов, которые смогут выполнять более сложные задачи на основе голоса и изображений.

Кроме того, Gemini 2.0 поддерживает многоязычные функции преобразования текста в речь и может интегрировать собственные инструменты, такие как поисковая система Google, а также возможности для работы с кастомными функциями. Gemini 2.0 будет интегрирован в различные продукты Google, включая поисковую систему, Workspace и другие сервисы. Gemini 2.0 также оснащен новыми возможностями в исследовательских задачах с функцией Deep Research, которая использует мощность ИИ для анализа и подготовки сложных тем. Ожидается, что доступ к новой модели станет доступен для всех пользователей в январе 2025 года.

🔥 Разрабы Ghostrunner показали новый геймплейный трейлер «соулслайка» во времена Наполеона

Новости Железо и технологии нейросети Google видео

Об авторе

Arkadiy Andrienko

Автор статей и новостей

Как технический журналист VGTimes, я с одинаковым удовольствием обсуждаю новейшие графические процессоры и углубляюсь в тонкости классических RPG. Начиная с 2018 года пишу об играх и оборудовании, мой опыт работы в области звукорежиссуры позволил мне хорошо разбираться в нюансах аудиотехнологий, и я всегда нахожусь в поиске чего-то нового в области игрового оборудования. Когда я не пишу о технологиях, то, скорее всего, я исследую постапокалиптические пустоши в Fallout, управляю колонией в RimWorld или командую армиями в Hearts of Iron IV. Для меня игры — это больше, чем просто хобби — это страсть, которая подпитывает мой творческий потенциал и поддерживает связь с постоянно развивающимся миром технологий.

Комментарии3

Оставить комментарий

БиллиБоб

11 месяцев

Все таки видать Джона Коннора убьют и не кому его будет спасти.

Ответить

Rintslerr Забанен

11 месяцев

чудо что этот скрипт вообще понимает его акцент из индии

Ответить

bobie

11 месяцев

Ждём ответочки от яндекса...

Ответить