В Томске нейросеть научили выявлять плагиат в программном коде
В Томском государственном университете систем управления и радиоэлектроники (ТУСУРе) разработали нейросеть для точного определения авторства в программных (исходных) кодах. Она позволит выявлять плагиат в компьютерных программах и упростит решение спорных ситуаций с интеллектуальной собственностью в сфере IT.
В основе любой программы лежит исходный код, представленный в виде текста, написанный на одном из языков программирования. Языки состоят из различных синтаксических наборов правил и комбинаций знаков.
«Разработанная методика анализа учитывает все особенности исходных кодов программ. Это стало возможно благодаря авторской глубокой нейронной сети, позволяющей находить признаки авторского стиля программирования даже в самых сложных случаях», – рассказал старший научный сотрудник НИЦ «Интеллектуальные системы доверенного взаимодействия» ТУСУРа Александр Романов.
Он также добавил, что предлагаемая методика позволяет анализировать не только созданные человеком исходные коды, но также и сгенерированные машиной, разделять авторство между ними, выявлять отличительные особенности каждой отдельно взятой генеративной модели.
Для ситуаций, когда программист пользовался двумя языками программирования, средняя точность определения авторства составила 87%, тремя и более – 76%, а в случае анализа искусственно-сгенерированного кода – 81,5%, отметили в вузе.
На следующем этапе разработчики планируют научить нейросеть выявлять программистов – авторов компьютерных вирусов.
Источник: РИА «Новости»