Новости В Gemini появился конкурент ChatGPT для редактирования изображений

В Gemini появился конкурент ChatGPT для редактирования изображений

DoubleA
Читать в полной версии

Пользователи приложения Gemini и разработчики на платформах Google AI Studio и Vertex AI получат доступ к обновленному инструменту для редактирования изображений. Новая модель, известная под псевдонимом Nano-banana, позволяет вносить в фотографии сложные правки по текстовому запросу.

Основное преимущество обновления — высокая точность и сохранение деталей. Если попросить большинство современных ИИ-сервисов цвет каких-то деталей на снимке, результат может разочаровать: лицо может исказиться, а фон измениться. Gemini 2.5 Flash Image справляется с такими задачами, корректно работая с мелкими элементами вроде черт лица, текстуры шерсти животных или узоров на одежде.

Компания также заявляет, что внедрила в систему строгие защитные меры. Нейросеть запрещено использовать для создания изображений интимного характера без согласия человека. Все сгенерированные картинки автоматически помечаются специальными метаданными и водяными знаками, чтобы пользователи могли отличить их от настоящих фотографий.

Запуск точного редактора изображений — важный шаг для Google в конкурентной борьбе с OpenAI, чат-бот которой, ChatGPT, насчитывает больше пользователей в неделю, чем Gemini в месяц. Новая функция в Gemini будет полезна в повседневных задачах: например, для визуализации идей по ремонту или подбора стиля в одежде, так как модель умеет совмещать в одном изображении несколько предметов по примеру. Полноценный доступ для всех пользователей будет открыт в конце августа.

Расширенный функционала для редактора изображений появился следом за расширением доступности NotebookLM, который получил поддержку более 80 языков. Судя по всему осень принесёт множество нововведений от ИИ-команды Google.

🤑 Слух: Battlefield перейдёт на ежегодные релизы по схеме Call of Duty
    Комментарии3
    Оставить комментарий
    18 часов
    Это хорошо. Чем больше конкуренции — тем больше стимула к развитию у конкурирующих сторон
    Ответить
    14 часов
    Я уже не успеваю ча тем, что чего делает. Изображения, видео, презентации, игры... Чего только ИИ не создаёт
    Ответить
    14 часов
    Людей)
    Ответить