
Компания OpenAI представила ChatGPT Images 2.0 — новую версию своего генератора изображений
Компания OpenAI представила новую версию своего генератора изображений — ChatGPT Images 2.0. Ключевое нововведение — мыслительные возможности ИИ-модели. При их активации модель не просто генерирует картинку, а сначала рассуждает над ее структурой, может искать информацию в интернете, анализировать загруженные пользователем файлы и даже исправлять собственные ошибки.
Одна из главных практических возможностей — генерация до восьми изображений одновременно с сохранением сквозных персонажей, объектов и стиля. В OpenAI поясняют, что это упрощает создание страниц манги, серии графики для соцсетей или дизайн-планов для всех комнат в доме.


В демонстрациях модель создавала сложную инфографику, диаграммы, конвертировала загруженные PDF-файлы в серии слайдов и генерировала образовательные пособия по запросу.
По словам разработчиков, ChatGPT Images 2.0 лучше понимает инструкции, сохраняет заданные детали и генерирует текст внутри картинок. Разрешение выросло до 2K, поддерживаются соотношения сторон от 3:1 до 1:3. Модель добилась «значительного прогресса» в создании изображений с текстом на японском, корейском, китайском, хинди и бенгальском языках.
Режим мышления доступен подписчикам ChatGPT Plus, Pro, Business и Enterprise. Бесплатно пользователи получают базовую версию без веб-поиска и расширенного рассуждения. Первая версия ChatGPT Images вышла в прошлом году, последнее крупное обновление датировалось декабрем.
Начиная с 21 апреля ChatGPT Images 2.0 доступен всем пользователям ChatGPT и Codex.
Текст: Майя Цветкова
Изображения: ChatGPT Images 2.0 / OpenAI
Подписывайтесь на каналы Let AI be в Telegram и «ВКонтакте» — оставайтесь в курсе главных новостей в сфере искусственного интеллекта!