Нейросеть научили распознавать рукописный текст на русском языке с точностью 99%
Специалисты из Сибирского федерального университета (СФУ) и Санкт-Петербургского государственного электротехнического университета «ЛЭТИ» создали сверточную нейросеть, которая распознает изображения рукописных букв русского алфавита с точностью 99%. Об этом сообщает «Научная Россия».
Модель глубокого обучения с высокой точностью распознает текст, написанный кириллицей от руки, независимо от почерка. Для нее разработали приложение, которое защищено от утечки информации и не требует подключения к интернету.
Как отметил соавтор исследования, студент Института информационных и космических технологий СФУ Андрей Левков, с развитием технологий растет важность быстрого и качественного преобразования рукописного текста в цифровую печатную версию, чтобы было удобнее копировать, редактировать или извлекать из него данные.
Программирование велось на языке Python в интерактивной среде разработки Jupyter. Искусственный интеллект обучался на предварительно обработанных данных хранилища CoMNIST, содержащего образцы рукописного написания букв на латинице и кириллице.
«Набор данных содержит 13299 фотографий, на которых зафиксированы прописные, печатные и написанные курсивом буквы. Приблизительно на 85% этих снимков нейронная сеть (CNN) училась распознавать буквы русского алфавита, а еще на 15% шла проверка усвоенных “знаний”. Мы сравнили разработанную нашим коллективом модель с наиболее мощными моделями CNN, например, с VGG-16, VGG-19 и другими. Оказалось, что точность нашей модели во время обучения составляла до 99%, все обучение заняло три часа. Точность прогнозирования модели составила до 95,83%», — рассказала руководитель исследования, доцент кафедры систем искусственного интеллекта СФУ Анастасия Сафонова.
В планах экспертов – обучить модель «читать» целые слова и предложения, а также освоить различные стили письма.
Уникальная программа зарегистрирована, ее правообладателем выступает СФУ.
Загрузить код, чтобы обучить модель на своем собственном наборе данных, можно по ссылке.
Фото: СФУ