Команда Yandex Cloud создала нейросеть-полиглота
Команда Yandex Cloud представила нейросеть-полиглота и открыла к ней доступ для пользователей Yandex SpeechKit. Новая модель на базе машинного обучения способна распознавать более 10 иностранных языков одновременно. По словам разработчиков, благодаря ей компании смогут проще и быстрее создавать многоязычных голосовых помощников и мультиязычных голосовых роботов для колл-центров с большим потоком клиентов.
Нейросеть понимает как популярные языки, например английский и французский, так и более редкие — датский, финский, турецкий. ИИ в любой момент может переключаться между языками и распознавать речь на любую тему и в разных форматах: короткие и длинные фразы, а также имена, адреса, даты и числа.
Мультиязычная модель работает на базе архитектуры Transformer. Модели-трансформеры обрабатывают входные слова параллельно и независимо друг от друга, благодаря чему быстро обучаются. Чтобы при переходе на другой язык текст получался связным и грамматически правильным, нейросеть обучали на десятках терабайтов данных из профессиональных датасетов и массивах данных из сервисов и приложений «Яндекса».
Напомним, недавно команда Yandex Cloud научила сервис синтеза и распознавания речи Yandex SpeechKit расставлять знаки препинания.
Фото: Freepik