Искусственный персонализированный голос: тембр на благотворительность

Метки

компьютеры, Аудио

Рейтинг

( 0 Рейтинг )

Рубрика

Инновации

16 Января 2015

Рейтинг: 0 / 5

В мире насчитывается около 2,5 млн людей, которые по разным причинам потеряли возможность разговаривать голосом, и за них это делает компьютер. Электронный голос звучит постоянно одинаково, и таких пациентов не отличить на слух. Однако скоро это может измениться, ведь в мире появился банк голоса, куда можно пожертвовать и свой.

Один из самых популярных физиков - Стивен Хокинг - известный также своей системой коммуникации. Буквы произносит компьютер, и этот голос стал иконой, а сам ученый уже считает его своим. Он пользуется одной системой коммуникации уже более 20 лет, но его болезнь продолжает прогрессировать, и текущее решение уже не справляется. И когда в Intel начали работу над новой, улучшенной, версии системы, у Хокинга была лишь одно требование - оставить его голос без изменений.

«Этот голос стал таким известным, что он считает его персональным голосом, - рассказывает Хорст Хоссекер. Он работает руководителем проекта обновлению коммуникационной системы и занимает должность директора лаборатории Intel Computational Imaging Lab. - Он основан на устаревшей технологии, но это делает его уникальным и его невозможно скопировать, даже если захотеть».

Идея создания банка голоса

Несмотря на то, что люди теряют способность разговаривать, они все равно хотят демонстрировать свою естественную индивидуальность даже при общении через компьютер. Исследовательница Рупал Пател в 2002 году выяснила, что для этого они изменяют тембр и высоту компьютерного голоса так, чтобы он был максимально похож на их собственный. Однако это не помогало, и различить личность пользователя на слух было невозможно.

«Я сложила два плюс два, - вспоминает она, - Я подумала, что если у них есть эта часть голоса, тогда можно построить для них персональное звучание». Эта идея осталась, и в последующие годы Пател развивала свои технологии. В 2007 году она основала свою компанию VocaliD, цель которой - создавать персональный голос для компьютерных систем вещания, которые используют немые люди. Для этого она смешивает звуки, выдающие пациенты, с записями слов от здоровых доноров. Эта услуга платная, а цена финального «голоса» зависит от начальных требований.

Создавать индивидуальный голос специалистам VocaliD удается благодаря тому, что звучание человека состоит из двух компонентов. Голосовые связки генерируют звук, а индивидуальности ему добавляет фильтр - путь, по которому проходит воздух внутри тела. Различные травмы влияют как раз на последний, а вот голосовые связки остаются рабочими.

Задача экспертов VocaliD - найти такого донора, который имеет похожий фильтр, и с помощью современных технологий наложить его на звуки, которые издает пациент. Стать донором такого банка голоса может каждый - для этого нужен компьютер, микрофон и несколько часов для записи сотен подготовленных предложений. Пока компания работает только с английским языком, поэтому записи выполняются ею.

После поступления записей специалисты VocaliD нарезают их на отдельные слова или словосочетания, которые можно склеивать вместе в любом порядке.

По оценкам Пател, голосовыми донорами стало уже 500-600 человек, а еще около 24 тысяч записались в добровольцы и готовятся сделать это в будущем. «В прошлом мы искали подходящий голос за базовыми параметрами донора - возрасту и полу, - рассказывает специалист. - Сейчас мы разрабатываем новые методы более тонкого поиска, чтобы принимать во внимание различные нюансы: качество голоса, хрипоту, акцент, рост и вес и тому подобное».

В будущем VocaliD планирует пойти еще дальше по пути персонализации и сделать так, чтобы искусственный голос взрослел вместе с пациентом. «Если у вас есть записи человека с определенными промежутками времени, вы увидите, что голос меняется, - говорит Пател. - Возможно, для этого не обязательно искать нового донора, а можно сделать это компьютерной обработкой».

«Очень трудно переоценить важность голоса в том, как мы представляем себя миру, - говорит ученый Университета Калифорнии Джоди Крейман. - Так же, как при взгляде на кого можно делать выводы, так же, и если услышать их голос. Уровень образования, здоровье, внешний вид, социальные способности - все это можно услышать из голоса. Если его потерять, тогда теряется социальное «я».

Создавать искусственные персонализированные голоса трудоемкое и длительное задание. Пока VoiceiD выполнило для трех девушек-подростков. Они звучат все еще роботизированно, но в их голосе отслеживается индивидуальность:

«Настоящий вопрос в том, как быстро мы можем возвращать людям их голос, - говорит Пател. - Список ожидания насчитывает более тысячи пациентов. На создание каждого голоса, кроме записи донора, нужно 10-15 часов».

В VocaliD также хотят зарабатывать деньги не только на инвалидах, но и продавать свои услуги обычным людям. «Можно озвучивать входящие электронные письма своим голосом, - говорит Пател. - Или сделать видеоигры более персональными, предоставив своим виртуальным героям собственный голос».

Искусственный персонализированный голос: тембр на благотворительность

Идея создания банка голоса

Похожие публикации

Популярное за неделю

Правила покупки

Интересные обзоры

О сайте

Самые популярные метки