Нейросеть Shap-E от OpenAI генерирует 3D-объекты по текстовому запросу
Компания OpenAI выпустила генеративную модель Shap-E для создания трехмерных изображений по текстовому запросу. В отличие от традиционных моделей для генерации 3D-объектов, которые выдают одно выходное представление данных, Shap-E конструирует разнообразные и сложные трехмерные объекты. Новая модель генерирует параметры неявных функций. Эти функции могут отображаться в виде текстурированных сеток или полей нейронного излучения (NeRF), что позволяет получать реалистичные 3D-изображения.
Команда разработчиков поделилась некоторыми результатами, которые выдала нейросеть Shap-E на текстовые запросы. Среди примеров: кресло, похожее на авокадо; самолет, который выглядит как банан; космический корабль; тарелка с овощами; пингвин и прочие.
Сообщается, что Shap-E генерирует высококачественные изображения всего за несколько секунд и работает лучше Point-E – другой нейросети для генерации 3D-моделей по текстовому описанию, которую компания OpenAI представила в конце прошлого года.
У Shap-E открытый исходный код. Модель вместе с весами, кодом логического вывода и образцом можно бесплатно скачать на GitHub. Нейросеть работает с Microsoft Paint 3D, а также файлами STL, что позволяет печатать созданные трехмерные объекты c помощью 3D-принтеров.
Напомним, в начале 2023 года Microsoft представила модель Avatar Diffusion, которая генерирует высокодетализированные 3D-аватары по фото.
Источник: Marktechpost
Изображения: Freepik (шапка); OpenAI
Подписывайтесь на каналы Let AI be в Telegram и «ВКонтакте» — оставайтесь в курсе главных новостей в сфере искусственного интеллекта!