OpenAI встроила в ChatGPT умную генерацию изображений на основе GPT-4o

Компания OpenAI интегрировала мощный инструмент генерации изображений прямо в ChatGPT. С сегодняшнего дня пользователи могут создавать детализированные визуалы, используя обновлённую модель GPT-4o, способную понимать контекст, обрабатывать сложные запросы и даже генерировать безупречный текст на изображениях.
Ранние версии ChatGPT использовали нейросеть DALL-E 3, но новая система, получившая название Images in ChatGPT, работает на базе мультимодального «универсала» GPT-4o. Это означает, что модель одновременно анализирует текст, аудио, видео и изображения, что радикально повышает точность. Теперь ИИ способен корректно связывать до 15–20 объектов в одном изображении, избегая ошибок, которые раньше возникали даже при 5–8 элементах.
Одним из ключевых улучшений стала возможность создавать изображения с идеально читаемым текстом — проблема, которая долго оставалась ахиллесовой пятой генеративных моделей. Теперь ChatGPT может генерировать меню для ресторанов, логотипы с надписями или инфографику без опечаток. Кроме того, пользователи получили функцию редактирования: загруженное изображение можно модифицировать, добавляя или удаляя элементы по простому текстовому запросу.
Новинка доступна для всех подписок ChatGPT, включая бесплатный тариф, где действуют лимиты, аналогичные DALL-E 3. При этом DALL-E останется в арсенале через кастомные GPT-модули. OpenAI уделила особое внимание безопасности: все изображения помечаются метаданными C2PA для идентификации ИИ-контента, а система блокирует запросы, связанные с насилием, дипфейками и иными злоупотреблениями.
-
ChatGPT Search стал доступнее — OpenAI бросает вызов поисковым гигантам
-
Новая версия ИИ от OpenAI GPT-4.5 выйдет на следующей неделе, а GPT-5 — в конце весны
-
OpenAI запустила GPT-4.5 для более естественного общения
-
ChatGPT станет видеорежиссёром: OpenAI интегрирует Sora в чат-бот
-
OpenAI завершает работу над чипом для ИИ — производство скоро стартует