ИИ обучается языку якутского народа
В рамках федеральной программы «Приоритет-2030. Дальний Восток» Арктическим государственным институтом культуры и искусств (АГИКИ) совместно с Национальной библиотекой Якутии была запущена акция «Ийэ тылгын харыстаа» («Сохрани родной язык»), приуроченная ко Дню родного языка и письменности в регионе.
С февраля этого года разработчиками был открыт сбор голосовых записей на якутском языке, и на сегодняшний день пользователи оставили уже около 6,5 тыс. аудиопримеров, чтобы ИИ смог научиться воспроизводить и генерировать фразы на языке представителей этого народа. Главной задачей, поставленной инициаторами проекта, является сохранение и расширение географии якутского в будущем.
По словам инициаторов и разработчиков проекта, многие современные модели ИИ не включают якутский язык, что ограничивает возможности его использования.
В рамках программы носитель языка может поделиться своим голосом для дальнейшего развития проекта. Внести свой вклад можно на специально разработанном сайте voice.nlrs.ru, прочитав три предложения на якутском языке. Также пользователи могут помочь разработчикам с распознаванием записей. На представленной платформе есть функция не только записи самого голоса, но и проверки аудиофрагмента на соответствие тексту. Эта возможность позволит быстрее обработать аудиоматериалы и ускорить процесс обучения нейросети.
На основе собранных голосовых записей ИИ будет учиться понимать якутский язык и говорить на нем, в том числе переводить, озвучивать тексты, видео- и фотоконтент.
Участники призывают носителей языка со всего мира поучаствовать в проекте, чтобы создать более разнообразные голосовые ИИ-технологии для продвижения языка якутов — самого многочисленного народа в Сибири.
Текст: Юлия Быстрова
Источник: официальный портал Республики Саха (Якутия)
Изображение: Национальная библиотека Якутии
Подписывайтесь на каналы Let AI be в Telegram и «ВКонтакте» — оставайтесь в курсе главных новостей в сфере искусственного интеллекта!