В чем сила Gemini 3 Pro. Новые возможности нейросетевой модели от Google

В чем сила Gemini 3 Pro. Новые возможности нейросетевой модели от Google

Arkadiy Andrienko

Google недавно выпустила новое семейство моделей Gemini 3: мультимодальные модели с акцентом на глубокие рассуждения могут работать с текстом, изображениями, видео и аудио. Разработчики подчёркивают способности к сложному планированию, автономному кодированию и масштабным многозадачным операциям, причём версия Pro поддерживает гигантский контекст до 1 млн токенов.

Другие статьи про нейросети и технологии

  1. Что известно про Genie 3 — нейросеть, которая может навсегда изменить игровую индустрию
  2. Эни — девушка-помощница чат-бота Grok 4. Рассказываем о горячей вайфу нейросети Илона Маска
  3. Насколько умен «пугающе умный» чат-бот Илона Маска?
  4. Самый дорогой iPhone 17 в истории, AirPods Pro 3 и умные часы Watch Series 11 — что показали на конференции Apple
  5. Что показали на WWDC 2025: операционная система iOS 26, интерфейс Liquid Glass и многое другое
  6. Какой SSD купить осенью 2025
  7. Обзор ноутбука HONOR MagicBook Pro 16 HUNTER 2025. Охотник за вашими задачами
  8. Обзор MSI FORGE GK600 TKL, Versa 300 и Maestro 300. Удачное трио для погружения в игры

Ключевые возможности и производительность

Улучшенное рассуждение. Gemini 3 Pro заметно обошла и предшествующие модели, и основных конкурентов в интеллектуальных тестах. Она набрала 37,5% в бенчмарке Humanity's Last Exam, что на 11 процентных пунктов больше, чем у GPT-5.1 (26,5%), а по другим общим задачам модель достигает порядка 90% правильных ответов — значительно выше прошлых версий Gemini.

Мультимодальность. Модель умеет интегрировать данные разных типов и одинаково хорошо воспринимает как рукописным текст, так и текст со скриншотов. Более того, нейросеть научилась отлично справляться с аудио- и видеоконтентом, анализируя как сказанное, так и происходящее в кадре. Поэтому новой модели можно давать не только текстовые инструкции, но и сложные графические и видеоинструкции.

Узнаем, что думает нейросеть про нашего маскота

На практике это позволяет загрузить несколько научных статей и видеолекций на определенную тему, а модель выдаст «интерактивные карточки» или симуляцию решения, связывая визуальное и текстовое содержание. Gemini 3 Pro вместо простого текста может создать полноценный интерактивный ответ — например, с симуляцией или графиком, адаптированным под запрос пользователя.

Кодирование и агентность. Gemini 3 Pro демонстрирует высокие результаты при генерации и анализе кода. В синтетическом тесте LiveCodeBench Pro (алгоритмическое кодирование) модель набрала 2439 Elo (против 1775 у Gemini 2.5). Кроме того, версия Pro интегрирована с инструментами (поиск, выполнение кода и пр.), что позволяет ей самостоятельно исполнять и отлаживать программы.

Пользуетесь ли вы нейросетями?

Результаты

Gemini 3 Pro может на естественном языке спроектировать интерфейс и сразу сгенерировать рабочий код веб-сайта. Еще модель из одного запроса способна создать фронтенд с анимациями на Tailwind CSS объёмом более 2000 строк, причём «с первой попытки» и без доработок, но не в 100% случаев.

Ещё Gemini 3 Pro поддерживает контекст до 1 млн входных токенов, а это примерно в 16 раз больше, чем у типичных моделей предыдущего поколения. Такая масштабность позволяет ей обрабатывать большие документы и «помнить» длительные диалоги.

Также, что немаловажно, «галлюцинаций» (явных ошибок в фактике) стало значительно меньше, но результат все равно лучше перепроверить, ведь ошибки всё же могут случаться.

Сравнение с конкурентами

Нужно учитывать, что различные модели делают акцент на разном. По части креативного письма и генерации дизайна Gemini 3 Pro функционирует отлично. С такого рода задачами, по мнению автора этих строк, однозначно обходит ChatGPT-5.1. Аналитические задачи и переводы также оказались сильной стороной Gemini.

С другой стороны, GPT-5.1 превосходит Gemini по скоростным и «базовым» задачам. Например, в решении типичной задачи на относительные скорости поездов GPT-5.1 сработал быстрее, чем нейросеть Google. Практические GPT-5.1 выигрывает за счёт более быстрой обработки простых запросов — ответы приходят секунд, в то время как идентичный запрос в Gemini обрабатывается порядка 10 секунд.

Anthropic Claude Sonnet 4.5, в свою очередь, традиционно фокусируется на устойчивости и безопасности, но Gemini 3 Pro обходит Claude по большинству тестов общего интеллекта и творческого мышления. В тех же тестах автоматизированного кодирования LiveCodeBench нейросеть Gemini тоже показывает высокий результат, Claude опережает лишь на 1%.

Иными словами, выбор модели зависит от задачи: Gemini 3 Pro — лидер в задачах глубокого рассуждения, мультимодальности, тогда как GPT-модели ценны своей эффективностью и отточенным опытом в продакшне. Claude же выделяется лучшим написанием кода и «этичностью» при очень длинном контексте.

Что вы чувствуете, глядя на развитие нейросетей?

Результаты

***

Gemini 3 Pro — мощная модель с расширенным функционалом, задающая новый стандарт по смешанному восприятию, рассуждениям и кодированию. Однако высокие оценки по бенчмаркам не снимают привычных оговорок, что модель довольно «тяжелая» в запуске (долгая латентность, высокие вычислительные затраты). Поэтому практическая ценность Gemini 3 (и особенно Pro-версии) проявится там, где действительно нужны необычные способности — при анализе больших данных, сложном программировании или многозадачных агентных сценариях.

Для массового пользователя и стандартных приложений текущих решений (GPT-5.1, Claude и др.) чаще всего уже достаточно. Из личного опыта можно сказать, что Gemini 3 впечатляет своей продвинутостью, но к выводам всё равно нужно относиться критически: на данном этапе модель лучше воспринимать как «очень развитый инструмент», а не как истину в последней инстанции.

В целом — мощный «цифровой ассистент», способный решать сложные задачи, но ему всё ещё нужен грамотный контроль человека.

    Об авторе
    Комментарии1