Имитация человеческого голоса. Новые технологии перевернут общество

Метки

Приложения

Рейтинг

( 1 Рейтинг )

Рубрика

Инновации

30 Апреля 2017

Рейтинг: 5 / 5

Произнесите 160 французских или английских фраз в приложение на смартфоне, которое разрабатывает компания CandyVoice – приложение проанализирует ваш голос и будет озвучивать им любой текст.

Звучание, правда, получается немного искусственное, но шеф компании Жан-Люк Кребуа обещает, что уже скоро его невозможно будет отличить от вашего естественного голоса. Аналогичную программу под названием FestVox разрабатывает Институт лингвистических исследований Университета Карнеги-Меллон для английского и четырех самых распространенных языков в Индии. А китайский интернет-гигант Baidu заявляет, что уже создал программу, которой достаточно послушать всего пятьдесят предложений, чтобы точно воспроизводить любой голос.

Клонирование (или «банкинг») человеческого голоса до сих пор было весьма недешевой делом, которое делали в студиях под заказ, преимущественно для людей, которые рисковали потерять голос из-за рака или операции. Для этого нужно было произносить множество фраз, причем каждый раз с разным эмоциональным ударением и интонацией (утвердительное предложение, вопрос, команда и тому подобное), чтобы охватить все варианты произношения. Стоимость такой услуги у компании AcapelaGroup в Бельгии составляет по меньшей мере 3000 евро и требует, как минимум, восьми часов студийной записи. Другие компании берут даже дороже и заставляют своих клиентов днями просиживать в студии.

Теперь этого всего больше не нужно. Приложение на смартфоне раскладывает сказанные вами фразы на микрофрагменты продолжительностью пять миллисекунд (каждый с точной высотой), которые использует как своеобразный голосовой алфавит, из которого комбинирует слова. С помощью этого приложения женщина, например, может предоставить свой голос программе, которая озвучивает текст на мониторе для ее слепого мужа. Шеф может записать свой командный тон на автоответчик для подчиненных на работе. Пользователь Facebook может прослушать пост голосом его автора, а родители, которые много времени проводят на работе, могут записать свои голоса на интерактивные игрушки, которыми играют их детишки. По крайней мере так видит будущее этой технологии Гирсон Сильберт, шеф компании VivoText из Тель-Авива, которая занимается клонированием голоса.

VivoText уже в следующем году планирует выпустить приложение, которое позволит пользователям регулировать не только скорость и интонацию озвученного текста, а даже уровень радости или печали в нем. Лицензию на использование этой программы VivoText планирует предоставить американскому производителю детских игрушек Hasbro. Компания хочет добиться полностью идентичного имитации голоса, однако в ней соглашаются, что успехи одновременно пугают и требуют предупредительных мер. Ведь, например, пранкеры могут записать проклятие голосом мамы и довести ребенка до отчаяния.

Еще больше пугает, что голос любого человека можно взять с YouTube или любого другого ресурса. Исследователям из Алабамского университета во главе с Нитешем Саксеною достаточно было пяти минут онлайновых записей, чтобы сымитировать голос с помощью программы FestVox. Когда эти записи использовали против биометрических голосовых программ, которые используют банки для проверки подлинности клиента, они смогли обмануть их в 80% случаев. А когда их дали послушать добровольцам в течение 90 секунд, те не смогли отличить подделки в половине случаев. По словам эксперта голосовых систем Джорджа Пепкуна, появление таких технологий «открывает безграничный потенциал для дезинформации», особенно если их используют как доказательство в суде. Др. Пепкун, который ранее работал как эксперт по синтезу человеческого голоса в Лос-Аламосской национальной лаборатории (военная лаборатория в Нью-Мексико), считает, что имитация голоса будет иметь и военное применение: например, можно будет дезинформировать вражеские войска голосом их командира.

Против подобных действий сегодня уже разрабатывают контрмеры. Компания Nuance Communications создает алгоритм, который будет распознавать крошечные колебания частоты в местах, где микрофрагменты голоса сшиты вместе. А разработчик фотошопа Adobe закодирует в созданный своим приложением VoCo искусственный голос специальные знаки, по которым компьютер сможет его распознать. Впрочем, даже несмотря на все это, легко представить, какой хаос воцарится в мире, если злодеи смогут копировать чей угодно голос.

Имитация человеческого голоса. Новые технологии перевернут общество

Похожие публикации

Популярное за неделю

Правила покупки

Интересные обзоры

О сайте

Самые популярные метки