Let AI be

Яркий онлайн-журнал про искусственный интеллект (Artificial Intelligence, AI)

 

Свяжитесь с нами

Пресс-релизы, предложения об инфопартнерстве и сотрудничестве,
в том числе запросы на рекламу, присылайте на почту редакции:

Ждем вас в соцсетях

Генеративный искусственный интеллект: о дивный новый контент

Генеративный искусственный интеллект: о дивный новый контент

Искусственный интеллект способен на многое: нейросеть пишет музыку, создает тексты, картинки, видео и не только. ИИ, который может производить новый контент, называют генеративным. Нейросеть воплощает творческие идеи с помощью полученных инструкций, шаблонов и структур входных обучающих данных. Этот тип системы предназначен не для анализа информации и ее классификации, а для сотворения нового и оригинального.

Генеративный ИИ подходит к заданию творчески и с энтузиазмом. Он является частью обширной области искусственного интеллекта. Эта кажущаяся новой технология на самом деле существует уже несколько десятков лет. А в последние годы стала использоваться наиболее активно.

История генеративного ИИ: основные вехи

Во второй половине XX века художником Гарольдом Коэном были разработаны компьютерные программы, создающие оригинальные художественные образы. Они получили название AARON. Работа над проектом велась с 1972 по 2010-е годы. Постепенно абстрактные рисунки усложнялись: добавлялись изображения камней, растений и людей. В 2000-х AARON вернулся к генерации абстрактных изображений, но уже в цвете.

В 2007 году Nvidia выпустила программно-аппаратную архитектуру CUDA (Compute Unified Device Architecture), позволяющую использовать графические процессоры для увеличения вычислительной производительности. То есть любому разработчику стала доступна мощь суперкомпьютера для обучения алгоритмов. Сейчас эта программная среда является основной для большинства ИИ-систем.

В 2012-м Алекс Крижевский, Илья Суцкевер и Джеффри Хинтон сделали сверточную нейросеть (CNN) под названием AlexNet. CNN, обученная на графических процессорах, была соединена с базой данных размеченных изображений ImageNet —так получился лучший визуальный классификатор.

Спустя пару лет были разработаны GAN — генеративно-состязательные сети. В 2015 году Google выпустил программу компьютерного зрения DeepDream. Она использует CNN для поиска и изменения изображений. После выхода DeepDream несколько компаний представили программы, превращающие фотографии в картины с помощью информации о стилях создания произведений искусств.

В 2018 году был открыт сайт Artbreeder, на котором пользователи могут генерировать и изменять лица, пейзажи и так далее. В 2021-м исследовательская лаборатория OpenAI выпустила программу, создающую изображения на основе текстового запроса, — нейросеть DALL-E.

Активный рост сегмента генеративного искусственного интеллекта начался в 2022 году. По данным американского фонда Acumen, рынок нейросетей, создающих контент, будет увеличиваться на 34,3% ежегодно в период с 2022 по 2030 годы, а по прогнозу аналитической компании Precedence Research — на 27%.

Генеративные модели ИИ

Генеративные модели ИИ — действенный способ создания нового контента на основе существующей информации. Используются для улучшения ранее известных данных и генерации ранее несуществующих.

Можно выделить 3 популярных типа моделей генеративного искусственного интеллекта:

1. Генеративно-состязательные сети (GAN)

Генеративно-состязательная сеть — алгоритм машинного обучения, который основан на сопоставлении двух нейросетей: одна (сеть G — generator) генерирует образцы, другая (сеть D — discriminator) стремится отличить правильные от неправильных.

GAN (generative adversarial network) были придуманы в 2014 году Яном Гудфеллоу. В случайном споре с друзьями аспирант Монреальского университета (Канада) предложил способ использования ИИ для генерации фотографий, неотличимых от реальных изображений. Вместо одной нейросети он предложил использовать две, которые должны взаимодействовать и постоянно обучать друг друга. Генераторная сеть создает изображение, сеть дискриминатора оценивает работу «приятеля».

Генеративно-состязательные сети активно применяют для создания картинок с людьми и животными и даже для написания настоящих произведений искусства, которые достойны висеть в галереях или выставляться на аукционах.

2. Общие авторегрессионные модели

Авторегрессионная модель (AR) — алгоритм машинного обучения, способный по существующим данным прогнозировать будущее. Своеобразный предсказатель работает на соотношении информации прошлого и будущего.

Такая модель подскажет прогноз погоды или динамику фондового рынка. Однако она не может быть абсолютно точна, поскольку прогноз, зависящий только от исторических данных, не учитывает непредвиденных обстоятельств и изменений.

3. Модели на базе трансформера

Трансформер — алгоритм, использующийся в основном в сфере обработки естественного языка. С его помощью можно писать стихи, генерировать текст и создавать код.

Модели на базе трансформера были представлены в 2017 году исследователями Google и Торонтского университета. Трансформер может обрабатывать данные не последовательно, а параллельно, что значительно ускоряет выполнение операции.

Генеративные нейросети

Генеративные нейросети за считанные минуты нарисуют по вашему запросу картинку, напишут новый хит или рассказ собственного сочинения. Ниже представлена подборка нейронный сетей для создания новых шедевров.

Нейросети для генерации картинок

Создание и обработка изображений очень популярны в наши дни. Иногда хочется найти оригинальную картинку или сотворить образ, не существующий в реальном мире. Тогда на помощь приходит искусственный интеллект.

◉ Kandinsky 2.2

Генеративная нейросеть от «Сбера». ИИ создает изображения в разных стилях по текстовому запросу пользователя. Понимает русский язык. Можно также загрузить существующее изображение и изменить его с помощью нейросети.

◉ Fotor

Простая и понятная нейросеть. Позволяет отредактировать несколько фотографий бесплатно и оформить платную подписку. Может удалить фон, наложить эффекты или улучшить качество картинки.

◉ Dream by WOMBO

Нейросеть с ограниченными бесплатными возможностями. Генерирует изображения по текстовым подсказкам, также можно загружать фото и редактировать их. В основном искусственный интеллект создает картинки-иллюстрации и рисунки.

◉ «Шедеврум»

Нейронная сеть от «Яндекса», представленная в виде приложений на Android и IPhone. Сервис позволяет не только генерировать новые изображения, но и делиться ими с другими пользователями. Картинкам, созданным другими авторами, можно поставить лайк.

◉ Midjourney

Известная нейросеть для создания картинок по текстовому запросу. К сожалению, сгенерировать изображение нейросетью Midjourney бесплатно больше не получится: весной 2023 года разработчики закрыли эту возможность. Теперь за создание картинок по текстовому запросу с ее помощью придется платить от $10 в месяц.

Нейросети для написания музыки

Музыкантам и ценителям звучащего искусства ИИ дает возможность создать небольшие оригинальные композиции и почувствовать себя настоящими звукорежиссерами.

◉ MuseNet

Нейронная сеть от OpenAI, которая может создавать четырехминутные музыкальные произведения. ИИ использует несколько инструментов и сочетает разные стили: от классической музыки до рока.

◉ Soundful

Сервис, генерирующий музыку всего за одно мгновение. Нейросеть просит зарегистрироваться, а затем выбрать жанр, шаблон, настройки. Есть бесплатный и платный тарифы.

◉ Soundraw

Нейросеть, которой можно задать темп, ритм, слова, и она предложит вам несколько вариантов музыкальных композиций. Также можно изменить уже существующую мелодию. Доступны бесплатная и платные версии.

◉ Jukebox

Еще одна нейросеть от OpenAI, созданная в 2020 году. ИИ может создавать аудиоконтент, в том числе имитировать голос человека. Однако минусом является то, что сервис требует больших мощностей, а также навыков программирования.

◉ Mubert

Нейросеть просит выбрать настроение будущего трека, его жанр, стиль и ввести запрос на английском языке. Можно создавать ремиксы и генерировать несколько мелодий одновременно.

Нейросети для создания текста

Необязательно быть писателем, чтобы создавать романы, и не только поэты могут сочинять стихотворения. Генеративный искусственный интеллект научился неплохо работать со словами и предложениями. Он способен заменить автора, редактора,  корректора, сценариста или драматурга.

◉ TryChatGPT на русском

ChatGPT на русском, не требующий для доступа регистрации, номера телефона или VPN. Сервис, созданный на базе языковой нейросети, обученной OpenAI, генерирует тексты и отвечает на любые вопросы. Чат-бот совершенствует навыки написания и редактирования текста. Он бесплатен, позволяет использовать разные инструменты, в том числе художественные приемы.

◉ RoboText.io

Еще один российский аналог ChatGPT, который можно использовать бесплатно и без регистрации. Программа позволяет генерировать сценарии, создавать уникальный текстовый контент быстро и просто.

◉ YandexGPT

Член семейства GPT от компании «Яндекс». Нейросеть, появившаяся в феврале 2023 года, пока находится на этапе тестирования. На основе информации, полученной из Интернета, ИИ создает свой собственный текст.

◉ «Порфирьевич»

Российский аналог GPT-2 появился в 2019 году благодаря программисту Михаилу Гранкину. «Порфирьевич» продолжает мысль пользователя и оформляет ее в текст. Можно творить текстовый контент в веб-версии или телеграм-боте.

◉ TurboText

Сервис делает рерайт текста на разных языках. ИИ также поможет сгенерировать креативный заголовок, перевод, описание товара, основываясь на его свойствах, и другой текстовый контент.

Плюсы и минусы генеративного ИИ

В последнее время развитие генеративного ИИ становится все более неудержимым. У этой тенденции можно выделить как положительные, так и отрицательные стороны.

ПлюсыМинусы
Повышение производительностиБессмысленность и нелогичность контента
Высокая скорость создания контентаВопросы авторского права
Анализ и исследование сложной информацииПроблемы с конфиденциальностью данных и распространением дипфейков
Уникальный контентЗамена ИИ рабочих мест

Генеративный ИИ может стать креативным помощником в создании неповторимого контента. На основе пользовательских подсказок нейросеть сотворит новое, неизвестное, необычное и увлекательное. Популярность технологий искусственного интеллекта связана с их возможностями, которые постепенно меняют наш образ жизни. Однако не стоит забывать о юридических, социальных, этических и других вопросах, которые затрагивают неоднозначного генератора идей.

Виктория РОДИЧЕВА

Изображения: inPRNT; Freepik; IStockPhoto; Sutterstock

Подписывайтесь на каналы Let AI be в Telegram и «ВКонтакте» — оставайтесь в курсе главных новостей в сфере искусственного интеллекта!

 

You don't have permission to register