Куратор Microsoft Research Ричард Ф. Рашид представил в Китае усовершенствованную версию системы распознавания речи и перевода, находящуюся в разработке уже несколько лет. О ней сообщалось весной текущего года, однако опубликованное накануне видео демонстрирует работу машинного переводчика в режиме реального времени. По словам Рашида, разработчикам удалось значительно снизить количество ошибок — соотношение достигает показателя 1 к 8.
Алгоритм, который использует система перевода, носит название Deep Neural Networks. Он основывается на моделях активности мозга, потому эффективность и скорость распознавания речи намного выше, чем у существующих аналогов. Кроме того, после часа обучения система способна озвучивать переведенные фразы голосом говорящего, а не сгенерированным и «безликим».
Демонстрация работы системы начинается с 6:25.
«Результаты пока далеки от идеала, и нам предстоит проделать огромную работу, однако технология выглядит весьма многообещающе, и мы надеемся, что в ближайшие несколько лет мы наконец пробьем языковой барьер», — написал в блоге Next at Microsoft Ричард Ф. Рашид.