Нейросеть ruDALL-E генерирует картинки по текстовому описанию на русском языке
«Сбер» представил первую нейросеть, генерирующую изображения по текстовому описанию на русском языке. Протестировать ruDALL-E можно бесплатно по адресу rudalle.ru.
ruDALL-E создана на архитектуре нейросети DALL-E, которую компания Илона Маска OpenAI представила в январе этого года. Однако в «Сбере» отмечают, что модель для английского языка так и не была полностью выложена в открытый доступ. Разработчики «Сбера» воспроизвели код и запустили обучение нейросети на платформе ML Space на базе суперкомпьютера «Кристофари». Так они получили аналогичный результат для русского языка.
С помощью нейросети ruDALL-E можно, как сообщают в «Сбере», создавать варианты архитектурного, интерьерного или промышленного дизайна, стоковые изображения, векторную графику, иллюстрации для рекламы, копирайта. Важно, что нейросеть генерирует уникальную картинку, а значит – дает возможность бизнесу в любой момент получить картинки со свободной лицензией.
Чтобы нейросеть могла генерировать бесконечное множество изображений, в нее заложили огромное количество параметров. «Сбер» создал два варианта модели: ruDALL-E XL содержит 1,3 миллиарда параметров (именно эту модель можно протестировать); ruDALL-E 12B – 12 миллиардов параметров.
«Обучение заняло 23 тысячи GPU-часов на массиве данных из 120 миллионов пар текст-изображение. Проект по обучению ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ», – подчеркивают в пресс-службе компании.
Редакция Let AI be протестировала нейросеть. У ruDALL-E ушло более 20 минут на то, чтобы сгенерировать изображение по нашему запросу «cчастливая жизнь искусственного интеллекта». Результат нас удивил.