Let AI be

Яркий онлайн-журнал про искусственный интеллект (Artificial Intelligence, AI)

 

Свяжитесь с нами

Пресс-релизы, предложения об инфопартнерстве и сотрудничестве,
в том числе запросы на рекламу, присылайте на почту редакции:

Ждем вас в соцсетях

Форум BIG DATA & AI 2022: повсюду «ядовитые грибы» и никаких гарантий

Форум BIG DATA & AI 2022: повсюду «ядовитые грибы» и никаких гарантий

«Составляя программу, мы готовились традиционно знакомить слушателей с тенденциями, технологиями и практиками в области больших данных и искусственного интеллекта, но жизнь внесла свои коррективы: итоговая повестка стала антикризисной», — отметила Ирина Шеян, программный директор 11-го форума BIG DATA & AI, организованного издательством «Открытые системы». В этот раз встреча прошла в гибридном формате 21 апреля и собрала почти 400 участников.

Big data сломалась

Спикеры обсудили самые насущные проблемы, волнующие профессиональное сообщество в условиях неопределенности, санкций и болезненного расставания с иностранными поставщиками платформенных решений. Не случайно пленарную сессию «Преодолеваем кризис вместе. Данные для общества, бизнеса, государства» открыл доклад Григория Борисенко из PwC в России на тему «Big data сломалась: текущие вызовы и возможные пути решения».

Согласно исследованию PwC, в настоящий момент упоминания больших данных в годовых отчетах встречаются на 78% чаще, чем в 2017 году: в среднем 48 раз. Годовой отчет — это способ общения компании со своими инвесторами и акционерами, подчеркнул эксперт. И если пять — семь лет назад big data фигурировала «для красного словца», то сейчас цифровые продукты, инициативы и дорожные карты, качество данных, использование элементов искусственного интеллекта — становятся повесткой для обсуждения на высшем уровне.

«Однако исторические данные, которые накапливаются внутри компаний, претерпели трансформацию — и не в лучшую сторону. В 2020-м, с наступлением пандемии, все пошли спасать бизнес, налаживать цепочки поставок — аналитика и качество данных ушли на второй план. На сегодняшний день ситуация усугубилась», — сказал спикер.

Математические модели и взаимосвязи параметров, влияющих на принятие решений, претерпели драматические изменения. Григорий Борисенко указал на необходимость переосмыслить эти модели и расширить  границы анализа.

Эксперт пояснил: если раньше ритейлер, заказывая продукты из-за рубежа, мог легко посчитать, например, себестоимость помидоров из Турции и спрогнозировать спрос, то сейчас нет. Логистика, сроки доставки, валютные риски существенным образом влияют на структуру затрат.

Большие данные как товар

Ключевое место в пленарной сессии заняла панельная дискуссия «Что делать, чтобы индустрия данных выжила», модератором которой выступила президент Ассоциации больших данных Анна Серебряникова. Участники дискуссии обсудили пути стабилизации рынка в кризисной ситуации и возможности развития российских инноваций в сфере данных объединенными усилиями бизнеса и государства. Были подняты проблемы применения риск-ориентированного подхода к оценке методов обезличивания данных, затронуты вопросы тестирования методов обезличивания в рамках экспериментальных правовых режимов, а также рассмотрены нерешенные задачи доступа к медицинским данным и перспективы института дата-посредников.

Анна Серебряникова уточнила, что к рынку больших данных эксперты относят три составляющих:

◉ вертикальные решения и услуги (приложения и сервисы для конечного пользователя, направленные на решение конкретных задач),

◉ технологические инструменты (ПО для выполнения общих задач, таких как анализ данных, ИИ, машинное обучение),

◉ цифровая инфраструктура (платформы, обеспечивающие поток данных, их хранение и вычисление).

По оценкам Ассоциации больших данных, в 2018 году рынок big data в России составил 42 млрд рублей, а его ежегодный темп роста – 12%. Однако в 2020-м объем рынка достиг лишь 45 млрд рублей, и в целом между 2018 и 2022 годами его рост замедлился. Почему? По мнению Анны, ответ лежит в области регулирования. 

«Что нам нужно было в 2018 году и что актуально сейчас для развития рынка? Это возможность рассматривать данные как товар, включить их в оборот, возможность дать тем компаниям, которые хотят развиваться на этом рынке, работать не в серой зоне — как это сейчас происходит в большом количестве экспериментов, — а в белой зоне. Мы хотим установить прозрачную систему контроля со стороны государства и снять риски борьбы с неизвестным. Мы наблюдали очень осторожную позицию регуляторов по всем направлениям и вызовам в сфере больших данных и искусственного интеллекта», — сказала Анна Серебряникова.

Эксперт уверена, что сейчас российским компаниям просто необходимо дать преимущество в регуляторике, и государство это понимает. Неспроста ведутся разговоры на уровне правительства об открытии доступа к данным государства на федеральном уровне для разработчиков искусственного интеллекта. Но эти инициативы продвигаются очень тяжело.  

«Тяжело, потому что на сегодняшний день у нас отсутствуют гарантированные методы обезличивания данных», — пояснила Айсалу Бадягина из Минцифры РФ.

Она добавила, что сейчас в ведомстве ведется активная работа по предоставлению разработчикам доступа к данным на площадке Минцифры, а также прорабатывается возможность запуска аккредитованных площадок, соответствующих всем требованиям законодательства, так называемых дата-посредников.

«На дистанции три – пять лет 70% цифровой экономики будет существовать вокруг рынка данных. Поэтому им нужно заниматься», — убежден Анатолий Дюбанов из Минэкономразвития РФ.

Действительно, цифровая экономика – это, по сути, оборот big data, согласился Руслан Ибрагимов из МТС. Почему не получилось ввести в этот оборот обезличенные данные? По мнению эксперта, мы долго занимались технической стороной вопроса. Но гарантии 100% обезличивания данных нет, поэтому получается замкнутый круг. Надо думать над юридическим аспектом. Спикер предложил ориентироваться на федеральный закон «О персональных данных» в редакции 2006 года. В нем указано, что обезличивание предполагает разрыв связи между данными и субъектом персональных данных. Если связь разорвана, то данные не являются конфиденциальными и могут быть в обороте.

Выступающие отметили важность разнообразных мер государственной поддержки IT-отрасли, которые распространяются в том числе на сектор больших данных и искусственного интеллекта.

Сергей Наквасин из Аналитического центра при Правительстве РФ напомнил, чтов этом году поддержка индустрии ИИ только в рамках одной госпрограммы составляет 6 млрд рублей, из них 4 млрд рублей пойдут малому бизнесу.

А Дмитрий Онтоев из ДИТ Москвы пригласил к сотрудничеству разработчиков ИИ-решений, которым город готов предоставлять дата-сеты для обучения моделей.

«Мы понимаем, что искусственный интеллект — это технология будущего. И самое важное сейчас — развивать технологию, которая позволит нам стать более конкурентоспособными, поможет снизить санкционные риски, поддерживать важные городские системы», — добавил Дмитрий.

Медицина катастроф в кибербезопасности

Впервые одной из приоритетных тем обсуждения на форуме стала кибербезопасность: об экстремальных мерах защиты, которых требуют экстремальные времена, рассказал Рустэм ХайретдиновBISA.

Число хакерских атак возросло. Между тем «государственной ПВО» в кибербезопасности нет, отметил спикер. Даже Росавиация недавно лишилась архивов данных из-за вторжения в свои системы. 

При этом сегодня направление атак – разрушение, а не выманивание денег как раньше. Торговаться никто не будет, предупредил эксперт. Нельзя доверять никому и ничему, тем более когда у нас «дыра в безопасности» из-за того, что часть средств защиты отключили.

И опасаться стоит не только внешних атак. Рустэм напомнил про недавний кейс «Яндекс.Еды» —данные пользователей слил сотрудник.

«Сейчас ситуацию в кибербезопасности можно сравнить с медициной катастроф. Если вы не можете спасти всех, нужно выбрать тех, кого получится вылечить с большей вероятностью. Если у вас нет возможности защитить всю цифровую систему, нужно решить, что отключить: что вы оставите жить, а чем готовы пожертвовать», — сказал эксперт.

По словам Рустэма Хайретдинова,сложность сегодня заключается и в том, что приходится обеспечивать кибербезопасность очень подвижных объектов. По мнению спикера, цифровые системы похожи на героиню Уитни Хьюстон из фильма «Телохранитель», которая постоянно уворачивается от попыток ее защитить.

Он также обратил внимание на нехватку знаний о новых атаках: «Как мы поняли, что некоторые грибы ядовиты? Кто-то съел и отравился, а потом другим людям об этом рассказали. Но если никто не рассказывает об атаках, мы не знаем про эти ядовитые грибы».

Работа с большими данными и технологиями искусственного интеллекта

Многие доклады номинантов Data Award стали настоящим украшением мероприятия. Выступления Тиграна Саркисова, X5, Александра Гусева, Webiomed, Дмитрия Шведова, «Уралхим», Андрея Михайлишина, «Цифровые платежи», позволили слушателям получить представление о текущем положении дел и ближайших перспективах дата-сектора в ретейле, здравоохранении, промышленности и финансах.

Благодаря партнерам форума— компаниям Denodo, Sapiens solutions, «БИТ», EasyData, Luxms — участники BIG DATA & AI 2022 из первых рук узнали о возможностях, доступных на российском рынке технологий для управления на основе данных.

Выступающие в двух параллельных сессионных потоках эксперты делились со слушателями ценным опытом решения задач как по созданию инструментов для работы с данными, так и по их применению. К примеру, Дмитрий Гольцов из «Мегапьютер Интеллидженс» разобрал решение прикладных задач интеллектуального анализа больших объемов текстовых данных с помощью платформы PolyAnalyst, которая позволяет в рамках одной системы применять алгоритмы машинного обучения и аналитический подход, основанный на правилах.

Как нейронными сетями выловить из озера полезные данные и применить полученные массивы для создания новых приложений, показали Антон Шебалкин и Богдан Стрелков из компании «Диасофт». А энтузиаст использования Kubernetes для построения Data Lake, хранилищ данных и ML-платформ в облаках Александр Волынский, VK Cloud Solutions, рассказал, с какими вызовами встречалась команда VK при работе с данными.

Характерно, что большинство представленных спикерами успешных кейсов управления данными реализовано в банковском секторе. О решении ряда задач для крупных банков рассказали Павел Бабурин из «Дататех» и Иван Кириленков из Denodo. Представители «Сбера» Светлана Сонина и Александр Горынин в совместном докладе поделились опытом построения облачного сервиса обмена данными, а Лариса Ихсанова познакомила слушателей с принятыми в «Сбере» подходами, обеспечивающими регулярную поставку потребителям данных из сотен источников для эффективной организации бизнес-процессов на базе ИИ-решений. Иван Кровяков, Data Platform Yandex.Cloud, и Александр Павлюк, УБРиР, в совместном докладе поделились своим подходом к построению DataOps/MLOps и показали, как правильно принятые решения могут привести к пятикратной окупаемости Data&AI-проектов в банке в первый же год внедрения.

Доклад Павла Скрибцова, «Павлин Технологии», был посвящен применению интеллектуальной системы контроля продукции птицеводства на основе компьютерного зрения и нейронных сетей, а выступление Алины Радаевой, «Нейроспектр», — быстрой разработке приборов, собирающих большие данные для такого контроля. Примерами решения реальных задач регионов с помощью ИИ-технологий и анализа данных поделилась Яна Коваленко из Центра цифрового развития АСИ, уделив особое внимание задачам социальной сферы.

Когда насыщенная деловая программа и продуктивный десятичасовой нетворкинг остались позади, самые активные участники получили призы от партнеров и организаторов форума, в том числе сертификаты на посещение следующих мероприятий «Открытых систем» в 2022 году. Ближайшее из них — «Роботизация бизнес-процессов — 2022» — пройдет в июне.

Фото: издательство «Открытые системы»

You don't have permission to register