Хай-тек Нейросеть "переключит" акценты в реальном времени

10 ноября 2021, 11:06

Персоны

Рубрика Николая Гринько на "Вестях ФМ".

Группа студентов Стэнфордского колледжа разрабатывает нейросеть, способную изменять акцент человеческой речи в реальном времени. Все началось с того, что один из них, уроженец Гватемалы, устроился на работу в кол-центр, но быстро потерял работу, так как абонентам не нравилось, что оператор говорит по-английски с акцентом, и они оставляли множество негативных отзывов. Его друзья тоже не говорят на чистом английском, поскольку они родом из России и Китая. Поэтому сокурсники организовали стартап под названием Sanas, и сейчас в нем работает 14 инженеров, рассредоточенных по всему миру. Компания работает над ИИ, который способен "переключать" акценты в английской речи: на американский, австралийский, британский, филиппинский и испанский. Также идет работа над адаптацией акцентов с других языков, например французского или русского. Несколько компаний, занимающихся обслуживанием клиентов, в настоящее время тестируют систему.

Коллектив редакции нашей программы довольно часто рассказывает о новейших речевых алгоритмах. Нейросети уже способны на многое: переводить речь в реальном времени с одного языка на другой, не изменяя тембра голоса; мгновенно создавать субтитры, которые тоже можно переводить; даже обрабатывать видео так, чтобы движения губ человека, чья речь переведена на другой язык, совпадали со словами этого языка. Мы даже прогнозировали, что в скором времени исчезнет необходимость дублировать кинофильмы: искусственный интеллект будет обрабатывать видео так, что голливудские актеры начнут совершенно без акцента говорить на любом языке, не теряя при этом тембра и точно попадая губами в текст. А уж при голосовых или видеозвонках между жителями разных стран вообще должны пропасть все барьеры: каждый из собеседников будет общаться на собственном языке, а нейросеть – "на лету" переводить его слова.

Однако за последние 2 – 3 года этого так и не произошло, несмотря на множество новостей о "революционных разработках", и мы никак не можем понять, в чем же дело. То ли технологии еще очень далеки от совершенства, то ли их внедрение требует серьезных усилий и больших средств. Правда, недавно в новостях рассказывали о том, что мошенники выудили у арабского банка 35 миллионов долларов с помощью технологии подмены голоса. Нам бы очень хотелось верить, что голосовые нейросети все-таки будут применяться для удобства пользователей, а вовсе не для высокотехнологичных преступлений. Хотя…

Хай-тек. Все выпуски

Популярное аудио

Новые выпуски

Авто-геолокация