
Ученые приблизили машинное зрение к человеческому
Исследователи из Южной Кореи и Германии с помощью нового метода на базе искусственного интеллекта обучили машины обрабатывать изображения так же эффективно, как это делает человеческий мозг. Их подход, получивший название Lp-Convolution, основан на принципах работы зрительной коры головного мозга и обещает значительно улучшить точность распознавания объектов, а также снизить вычислительные затраты.
Обычно в компьютерном зрении используются либо традиционные сверточные нейронные сети (CNN), которые плохо улавливают сложные детали изображений из-за фиксированных фильтров, либо визуальные трансформеры, которые требуют огромных вычислительных ресурсов. Lp-Convolution за счет гибких фильтров адаптируется к форме объекта — похожим образом нейроны в мозге фокусируются на ключевых деталях.
Ученые протестировали Lp-Convolution на наборах данных CIFAR-100 и TinyImageNet и убедились в улучшении результатов и уменьшении ресурсоемкости в сравнении с другими моделями. А еще они нашли сходство своего метода с нейронной активностью мозга мышей.
Теперь ученые намерены проверить возможности этой технологии в более сложных задачах, например по решению головоломок и обработке видео в режиме реального времени. Код и предобученные модели Lp-Convolution опубликованы в открытом доступе на GitHub, чтобы другие исследователи могли проводить свои эксперименты с этой разработкой и улучшать ее.
Текст: Майя Цветкова
Источник: Institute for Basic Science
Изображение: Freepik
Подписывайтесь на каналы Let AI be в Telegram и «ВКонтакте» — оставайтесь в курсе главных новостей в сфере искусственного интеллекта!