ИИ-ассистент Gemini от Google стал более универсальным, теперь пользователи могут загружать в чат с нейросетью не только текст, изображения и видео, но и аудиофайлы. Новое обновление ассистента значительно расширяет возможности практического применения помощника в повседневных задачах.
Нововведение позволяет напрямую загружать записи в форматах: MP3, WAV или M4A. Функция открывает несколько полезных сценариев для работы и учебы. Теперь Gemini может быстро расшифровать запись лекции или интервью, создав точную текстовую транскрипцию, также нейросеть способна проанализировать длинное совещание или подкаст и составить краткий конспект, выделив только ключевые тезисы и решения, что с экономит время пользователя.
Однако есть некоторые ограничения, зависящие от типа аккаунта. Для тех, кто пользуется бесплатной версией Gemini, максимальная длительность обрабатываемого аудио составляет 10 минут, а в сутки можно сделать не больше пяти подобных запросов. Для подписчиков платных тарифов — Google AI Pro и Ultra — лимиты значительно выше: можно анализировать записи длиной до трех часов.
Помимо аудио, обновление касается и других форматов. В чат можно загружать пакеты файлов, включая целые папки с кодом с GitHub (до 5 000 файлов), а также ZIP-архивы, содержащие до 10 элементов. Общий размер загружаемых данных для одного запроса не должен превышать установленных лимитов.
Это обновление — еще один шаг в стратегии Google по созданию единой экосистемы умных помощников и постепенно расширяя функционал своих продуктов функциями ИИ. Ожидается, что в будущем интеграция между Gemini и другими продуктами Google будет только усиливаться, предлагая еще более плавный опыт для решения повседневных задач.