Несмотря на эти достижения в области звука, нас еще долго будут раздражать автоматические голоса, которые сообщают о «неожиданном предмете в зоне выдачи багажа» или советуют «сделать поворот на 180° при первой возможности». Клиффорд Насс, покойный профессор Стэнфордского университета, занимавшийся проблемами коммуникации, полагал, что это чувство раздражения возникает потому, что мы воспринимаем компьютерные голоса как человеческие и оцениваем их достоверность, искренность и особенности характера. В одном исследовании компания BMW обнаружила, что водители предпочитают, чтобы их система спутниковой навигации звучала как компетентный второй пилот-мужчина, а не как командирша на заднем сиденье {318} 318 Logan T . Nice talking to you, machine // New Scientist. 2007. Vol. 2590.
. Саймон Кинг считает, что в системах, подобных Siri, важно использовать заранее заготовленные фразы и неестественные звуки с невыразительной интонацией — так пользователи перестанут ожидать слишком многого. «Если голос звучит как человеческий, — говорит он, — люди думают, что у него есть и другие присущие человеку качества, например разум».
Android Repliee Q2 — вызывает эффект «зловещей долины»?
Разработчики должны приложить усилия, чтобы избежать еще одной проблемы — явления под названием «зловещая долина» {319} 319 Spinney L . Exploring the uncanny valley: Why almost-human is creepy // New Scientist. 2017. Vol. 3097.
. Эта фраза была придумана японским профессором Масахиро Мори в 1970-х годах. Он хотел выяснить, почему некоторые гуманоиды вызывают у людей страх и лишают присутствия духа. Профессор Мори пришел к выводу, что подобные ощущения возникают, если робот выглядит почти как человек, но что-то в его внешности не совсем правильное: слишком большие или безжизненные глаза, может быть, сочетание человеческого и нечеловеческого в лице, напоминающее жутковатую версию Мистера Картофельная Голова. Эффект «зловещей долины» привел к коммерческому провалу фильмов, подобных «Полярному экспрессу», хотя он вполне подойдет для фильмов ужасов, которые как раз и предназначены для того, чтобы вызывать у людей страх.
Мори построил диаграмму, на которой показал зависимость эмоциональной тяги людей к роботам от схожести их внешнего вида с внешним видом человека. Представьте робота, который сначала совсем не похож на человека и больше напоминает механическое устройство, но постепенно его черты меняются и он начинает походить на человека. Мори предсказал, что в определенной точке, как раз перед тем, как робот станет выглядеть совсем как человек, притягательность сменится отвращением. Следовательно, диаграмма покажет резкое падение, которое и образует «зловещую долину». Некоторые сомневались, что догадки Мори верны. Иногда роботы, похожие на людей, вызывают скорее изумление, чем неловкость {320} 320 Makarainen M., Katsyri J., Forger K., Takala T . The funcanny valley: A study of positive emotional reactions to strangeness // Proceedings of the 19th International Academic Mindtrek Conference. 2015. P. 175–181.
. Другие полагают, что неприятные ощущения возникают из-за несовместимости черт лица робота, из-за чего наш мозг пытается понять, что же здесь не так {321} 321 Katsyri J., Forger K., Makarainen M., Takala T . A review of empirical evidence on different uncanny valley hypotheses: Support for perceptual mismatch as one road to the valley of eeriness // Frontiers in Psychology. 2015. Vol. 6. P. 390.
.
Но воспринимаем ли мы так же и синтетические голоса? Есть множество примеров голосов, очень похожих на человеческие, но не вызывающих отвращения. Вероятно, когда мозг обнаруживает неполадки в синтезированной речи, он понимает, что она искусственная или что-то исказило голос еще до того, как он достиг наших ушей. И только когда слух и зрение задействуются одновременно, несоответствие между этими модальностями может привести к проблемам. Ощущение чего-то зловещего может быть вызвано тем, что внешность и голос не соответствуют друг другу или голос робота слишком похож на человеческий {322} 322 Mitchell W. J., Szerszen Sr. K. A., Lu A. S. et al . A mismatch in the human realism of face and voice produces an uncanny valley // i-Perception. 2011. Vol. 2 (1). P. 10–12; Tinwell A., Grimshaw M., Nabi D. A. The effect of onset asynchrony in audio-visual speech and the Uncanny Valley in virtual characters // International Journal of Mechanisms and Robotic Systems. 2015. Vol. 2 (2). P. 97–110.
.
Я видел разных роботов, выступавших на сцене, и помню только одного, который вызвал у меня мурашки по коже. Это была Bina48, с которой я познакомился в 2016 году на Международном фестивале документального кино в Шеффилде. У нее имеются только голова и плечи, закрепленные на подставке, и нет туловища. Bina48 была создана в рамках проекта по передаче информации от человека к машине. По словам участников, они хотели создать «сознательный аналог человека» {323} 323 https://www.lifenaut.com/ .
. Речь этого робота собрана из записей реальной Бины Ротблатт. Программа распознавания речи использует искусственный интеллект, позволяющий роботу вступать в беседу и отвечать на вопросы, которые ему задают. Кроме того, в голову Bina48 встроены различные моторчики, позволяющие ей принимать человеческое выражение лица. Она смотрит по сторонам и дергается, как неугомонный ребенок. Возможно, мне она кажется такой жуткой именно из-за этих визуальных эффектов.
Читать дальше
Конец ознакомительного отрывка
Купить книгу