Нейросеть ruDALL-E генерирует картинки по текстовому описанию на русском языке

3.83k

Нейросеть ruDALL-E генерирует картинки по текстовому описанию на русском языке

05.11.2021

«Сбер» представил первую нейросеть, генерирующую изображения по текстовому описанию на русском языке. Протестировать ruDALL-E можно бесплатно по адресу rudalle.ru.

ruDALL-E создана на архитектуре нейросети DALL-E, которую компания Илона Маска OpenAI представила в январе этого года. Однако в «Сбере» отмечают, что модель для английского языка так и не была полностью выложена в открытый доступ. Разработчики «Сбера» воспроизвели код и запустили обучение нейросети на платформе ML Space на базе суперкомпьютера «Кристофари». Так они получили аналогичный результат для русского языка.

С помощью нейросети ruDALL-E можно, как сообщают в «Сбере», создавать варианты архитектурного, интерьерного или промышленного дизайна, стоковые изображения, векторную графику, иллюстрации для рекламы, копирайта. Важно, что нейросеть генерирует уникальную картинку, а значит – дает возможность бизнесу в любой момент получить картинки со свободной лицензией.

Одна из иллюстраций авторства ruDALL-E, которую в качестве примера работы нейросети приводит «Сбер»

Чтобы нейросеть могла генерировать бесконечное множество изображений, в нее заложили огромное количество параметров. «Сбер» создал два варианта модели: ruDALL-E XL содержит 1,3 миллиарда параметров (именно эту модель можно протестировать); ruDALL-E 12B – 12 миллиардов параметров.

«Обучение заняло 23 тысячи GPU-часов на массиве данных из 120 миллионов пар текст-изображение. Проект по обучению ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ», – подчеркивают в пресс-службе компании.

Результат тестирования ruDALL-E редакцией Let AI be

Редакция Let AI be протестировала нейросеть. У ruDALL-E ушло более 20 минут на то, чтобы сгенерировать изображение по нашему запросу «cчастливая жизнь искусственного интеллекта». Результат нас удивил.