Нейросеть PANN обошла ключевые проблемы глубокого обучения
Нейронные сети глубокого обучения могут обеспечить очередной цивилизационный рывок. Между тем с этой AI-технологией связаны серьезные проблемы, которые удалось преодолеть российским инженерам. Об этом специалист в области теории решения изобретательских задач (ТРИЗ), представитель компании Progress Анатолий Гин рассказал на конференции «ЦифраВидение. Цифровая трансформация бизнеса с нуля».
Спикер напомнил, что, согласно данным инвестиционной компании ARK Investment, к 2020-му году интернет добавил $13 трлн к рыночной капитализации во всем мире. Глубокое обучение, как недавно появившаяся технология, – всего $2 трлн. Однако, по прогнозам аналитиков, deep learning увеличит капитализацию мирового фондового рынка на $30 трлн в следующие 15-20 лет, в то время как интернет – лишь на $20 трлн.
В то же время, как отметил Анатолий Гин, бурное развитие нейронных сетей сопровождается тремя ключевыми проблемами, на которые указали в своем отчете The Great AI Reckoning эксперты Института инженеров электротехники и электроники (Institute of Electrical and Electronics Engineers, IEEE). К ним относятся:
✓ колоссальная энергоемкость, которая резко возрастает при увеличении сложности задач и объема данных. «Для обучения нейронной сети на суперкомпьютере, чтобы она потом могла обрабатывать bid data, нужно столько энергии, сколько потребляет Нью-Йорк в течение месяца», – привел пример Анатолий Гин;
✓ слишком долгое обучение искусственных нейронных сетей. Теоретически вычисления должны масштабироваться как минимум в четвертой степени относительно фактического повышения производительности. На практике же для этого требовалось масштабирование как минимум в девятой степени (то есть данные нужно прогонять через нейросеть огромное количество раз);
✓ «катастрофическое забывание» – невозможность доучивания уже обученной сети без принятия сложных и дорогих процедур.
Как рассказал спикер, группа инженеров и специалистов в области ТРИЗ из компании Progress разработала технологию, снимающую все ключевые проблемы, обозначенные в докладе IEEE. Она называется PANN, что расшифровывается как Progressive Artificial Neuro Net. Особенность этой технологии в том, что вместо нейрона, на котором построены другие сети, применен новый нейрон – и он ближе к биологическому.
По словам Анатолия, их нейросеть обучается всего за 3-10 раз прокручивания данных, ее можно доучивать в режиме реального времени. К тому же, она предусматривает малое количество «вычислительных действий» во время обучения, что связано с новым типом обучения, не требующим решения большеразмерных уравнений. Вести обучение возможно на недорогих компьютерах классов Mainframe, Workstation и даже ПК.
Компания Progress семь лет занималась исследованиями и тестированием этой разработки. Сейчас на базе PANN создается нейронный сервер Omega. Альфа-версия этой платформы искусственного интеллекта уже готова, сообщил Анатолий.
Omega Server можно будет применять для нейросетевого творчества, систем здоровьесбережения, индивидуализации образования, автоматизации производственных процессов и так далее.
Текст: Наталья ТРАВОВА
Фото: Unsplash