Если вы предпочитаете, чтобы ваш робот-певец выступал в более классическом стиле, стоит обратиться к Павароботти {301} 301 Можно найти на YouTube.
. Подобно настоящей оперной звезде, этот робот одет во фрак, в руке у него белый платок, а в конце представления он поднимает обе руки в знак благодарности за аплодисменты слушателей. Его голова — это экран, на котором зрители видят мультяшное лицо. Компьютер синтезирует арию Nessun Dorma из оперы Пуччини «Турандот», а голос исходит из динамика, спрятанного внутри фрака. Павароботти — это изобретение Инго Титце, который руководит Национальным центром голоса и речи в штате Юта. Сам Титце — хороший оперный тенор, и на представлениях он поет на низких нотах, а Павароботти — на высоких. Люди платят большие деньги, чтобы услышать, как тенор точно и мощно берет высокие ноты, но на самом деле именно такие ноты компьютеру создать просто. Значительно труднее создать нужный тон, ударение и интонацию в более спокойных и низких фрагментах арии, чтобы они звучали убедительно.
В основе Павароботти — компьютер с программой, решающей математические уравнения. Они описывают, как под действием воздушного потока создается звук, как он далее изменяется из-за резонанса в голосовом тракте и распространяется в полость рта. Компьютерной программе требуются тома подробнейших инструкций, описывающих быстро изменяющуюся геометрию голосовой анатомии. Написать все это непросто — для создания числовой информации для ввода в компьютер потребовалось почти пять месяцев. Но дело стоило того: Павароботти с восторгом приняли на концертах. Звуки, производимые компьютером, звучат натурально, в них нет даже намека на искусственность. Старая поговорка шоу-бизнеса гласит: «Всегда заставляйте хотеть большего». Именно это и сделал Павароботти, ведь Титце запрограммировал лишь одну арию.
Титце создал Павароботти, чтобы разобраться в механизме пения. Например, он продемонстрировал, что опущение гортани и сужение голосового тракта как раз над голосовой щелью создает «звонкость» оперного тенора, именно поэтому его хорошо слышно в больших залах. Разрешение на создание робота Титце получил у Лучано Паваротти, и оперной суперзвезде это явно было приятно. Паваротти был заинтересован в том, чтобы просвещать людей, поэтому дал проекту «свое благословение». Титце сказал мне: «Тенор назвал проект нашим детищем. И еще сказал что-то вроде “Хорошая работа, продолжай в том же духе”». Когда я спросил Титце, смогут ли компьютерные оперные певцы заменить живых исполнителей, он ответил: «Надеюсь, это случится не скоро, потому что я люблю настоящее пение. — И добавил: — Я думаю, голос нужен не только для художественных целей или для передачи слов от одного человека другому. Я считаю, что пение — это залог хорошего здоровья».
Системы, подобные Павароботти, пока не представляют угрозы человеческому пению, потому что создание разных голосов и огромных словарей в настоящее время нецелесообразно. Если «весь мир — театр», тогда «каждый [робот] не одну играет роль [32] Фраза из монолога Жака комедии Шекспира «Как вам это понравится» дана в переводе Т. Л. Щепкиной-Куперник.
». Для того чтобы машина научилась производить разнообразные уникальные и богатые голоса, нужен другой подход.
Историю систем производства речи, подобных Siri в iPhone, можно проследить до работ Дадли и других ученых из Лабораторий Белла. Наряду с изобретением Водера, эти люди создали очень похожее изобретение, с которым мы уже встречались ранее, — вокодер. Эта технология сыграла важную роль во Второй мировой войне.
В ходе этой войны секретная связь между союзниками была жизненно необходима. Но уже в первые дни войны германские специалисты по взламыванию шифров придумали, как расшифровать и подслушивать разговоры, — например, трансатлантические телефонные переговоры между президентом Рузвельтом и премьер-министром Черчиллем {302} 302 Boone J. V., Peterson R. R. Sigsaly — The Start of the Digital Revolution // NSA. 2016. https://www.nsa.gov/about/cryptologic-heritage/historical-fig-ures-publications/publications/wwii/sigsaly-start-digital.shtml .
. Была необходима новая система шифрования звонков, и решением, разработанным Лабораториями Белла в 1943 году, стал вокодер SIGSALY [33] SIGSALY — это вымышленное название, а не аббревиатура. — Примеч. автора .
. Он участвовал в военных операциях, в том числе в атомной бомбардировке Японии {303} 303 Kahn D . How I Discovered World War II’s Greatest Spy and Other Stories of Intelligence and Code. CRC Press. 2014.
. Вокодер — сокращение от «кодировщик голоса» (voice coder), с помощью электроники он разбирает записанную на микрофон речь, разделяя ее на источник (гудение голосовых связок) и фильтр (окрашивание звука голосовым трактом). Затем разделенная на два потока речь шифровалась и отправлялась через Атлантику. За океаном эти сигналы дешифровывались, а голос восстанавливался с использованием особой технологии, подобной технологии Водера. Военные записи не сохранились, но, судя по описаниям, речь можно было (хотя и с трудом) разобрать.
Читать дальше
Конец ознакомительного отрывка
Купить книгу