Let AI be

Яркий онлайн-журнал про искусственный интеллект (Artificial Intelligence, AI)

 

Свяжитесь с нами

Пресс-релизы, предложения об инфопартнерстве и сотрудничестве,
в том числе запросы на рекламу, присылайте на почту редакции:

Ждем вас в соцсетях

ИИ-модель SeamlessM4T переключается между сотней языков при переводе

Модель SeamlessM4T переключается между сотней языков при переводе

Недавно компания Meta* выпустила свою новую языковую ИИ-модель под названием SeamlessM4T (Massively Multilingual and Multimodal Machine Translation) — универсальную систему, выполняющую широкий спектр задач по обработке речи и текста. Эта нейросеть распознает около 100 языков — от английского до хинди — и выдает результат на 35 языках. При этом особенность модели SeamlessM4T в том, что она способна понять, когда человек использует несколько языков сразу, и переключается с одного на другой.

Преимущества представленной модели — в ее многоязычности и многозадачности, то есть способности расшифровывать и переводить речь или текст в различных комбинациях. Это может быть преобразование речи в речь / речи в текст / текста в речь / текста в текст / автоматическое распознавание речи.

Чтобы воплотить модель в жизнь, разработчики извлекли веб-данные (десятки миллиардов предложений) и речь (четыре миллиона часов) из общедоступных источников и использовали их для создания открытого датасета для перевода SeamlessAlign. В общей сложности, по словам компании, ей удалось сопоставить более 443 тысяч часов речи с текстами и преобразовать около 29 тысяч часов речи.

В прошлом году Meta* выпустила NLLB-200 (No Language Left Behind) — модель машинного перевода, которая может поддерживать 200 языков. Также компания разработала SpeechMatrix — крупномасштабный многоязычный набор данных для перевода речи в речь, а также модель Massively Multilingual Speech, поддерживающую автоматическое распознавание речи (ASR) и синтез текста в речь (TTS) более чем на 1100 языках, а также идентификацию (LID) более чем 4000 языков. Кроме того, Meta* продемонстрировала Universal Speech Translator — первый переводчик устной речи, работающий для языков, которые являются в основном устными и не имеют своей письменности.

Хотя новейшая модель SeamlessM4T и основывается на предыдущих разработках компании, это еще один шаг Meta* к созданию ИИ-модели для перевода, которая будет работать на всех языках мира.

Текст: Юлия Быстрова

Источник: The Verge   

Изображение: Adobe Stock (шапка); *Meta

*компания признана экстремистской и запрещена на территории России

Подписывайтесь на каналы Let AI be в Telegram и «ВКонтакте» — оставайтесь в курсе главных новостей в сфере искусственного интеллекта!

 

You don't have permission to register