Союз дикторов обратился в Госдуму с просьбой защитить их голоса от копирования с помощью технологий искусственного интеллекта
"Рано или поздно мы лишимся рабочих мест водителей такси, это будут автопилоты. С дикторами история ровно такая же. Потому что диктор – это профессиональный человек, который готовился. Многим кажется, что это простой труд, но на самом деле нет. Это действительно работа, обучение, долгий опыт, который позволяет стать диктору хорошим диктором. И здесь опасность не для всего рынка, дикторы будут востребованы. А опасность в том, что очень дешево и быстро можно скопировать хорошего диктора. Можно натренировать нейросеть и получить, например, в навигаторе в машине голос другого человека, известного. И закон сейчас никак не защищает. Доказать, что именно ваш голос используется – нельзя. Закона, который запрещает это делать, тоже нет. Это новая территория. Поэтому такой закон должен появиться. В Китае уже есть такие законы, которые запрещают напрямую копировать голос другого человека, вне зависимости диктор он или нет. И это правильно, на мой взгляд".
Играют ли на руку злоумышленникам сегодняшние приспособления?
"С помощью голоса напрямую никого ограбить нельзя. Я не знаю банков, которые выдавали бы деньги, осуществляли переводы именно таким образом. Но, например, если вы синтезируете голос кого-то из ваших знакомых и решите пошутить над ним, и будете придерживаться некой легенды, когда человек действительно узнает ваш голос, это открывает огромное поле для мошеннических действий. И это большая опасность для всех нас".
Легко ли установить и поймать таких специалистов, подделывающих голоса?
"Я думаю, что это будет нелегко. Потому что у нас в течение двух-трех лет появятся массовые инструменты, любой школьник может это делать. Голос не будет тем идентификатором, по которому мы будем узнавать человека".
Что такое нейросеть простыми словами?
"Нейросеть – это некий алгоритм, которого у нас раньше не было. Он копирует в какой-то мере, но очень отдаленно, как действует нервная система человека, психика, если так можно сказать. Но самое главное, что мы скармливаем нейросети какие-то задачи, а на выходе она каким-то образом их решает, то есть есть алгоритмы, заточенные под решение этих задач, и на выходе мы получаем, например, картину, голос или еще что-то. И мы тренируем нейросети так, чтобы на выходе результат нас устраивал – чтобы совпадение с оригиналом, например, с голосом другого человека было максимальным – 99%. И вот этот спектр алгоритмов позволяет решать такие задачи. И они достаточно дешево стоят. Поэтому массовые программы появляются. Звучит очень просто, но на самом деле там сложная математика, вычислительные мощности для этого первоначально нужны. Поэтому это не простая штука, но объяснить ее можно достаточно легко: это алгоритмы".
О будущем нейросетей:
"В ближайшее десятилетие нейросети полностью изменят то, как мы общаемся с нашими устройствами, появятся прототипы устройств – наушников, смартфонов, компьютеров, где будут полноценные голосовые ассистенты – это будут полноценные диалоги, мы сможем общаться с нашими устройствами. А кто-то, как в фильме "Она", сможет влюбляться в своего голосового ассистента".