Тревор Кокс - Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта
- Название:Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта
- Автор:
- Жанр:
- Издательство:КоЛибри, Азбука-Аттикус
- Год:2020
- Город:М.
- ISBN:978-5-389-17812-0
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Тревор Кокс - Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта краткое содержание
Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Технология дает возможность создавать подобные эффекты на кончиках пальцев звукооператоров, позволяя записи выйти за пределы того, чего можно достигнуть естественным путем. Это касается всех видов искусства: как только инструменты становятся широкодоступными, художественные достоинства результата начинают меняться. Каким бы ни было эстетическое качество конечного продукта, речь идет об изменении голоса, потому что человек все равно будет копировать звуки, полученные в студии, даже если в итоге они будут звучать искусственно, как у робота. Но плохо ли это? Певческий голос развивался тысячелетиями, и то, что мы наблюдаем сегодня, — лишь технология, ускоряющая эту тенденцию.
А что, если вообще избавиться от человека-певца и человека-оратора и использовать синтетические голоса? Пойдут ли люди в театр, чтобы смотреть, как играют роботы-актеры?
6
Все роботы — актеры
Первые демонстрации записи голоса, проведенные Эдисоном, вызвали ажиотаж, но временами царапанье иглы по фольге перекрывало речь. При воспроизведении звук искажался, и New York Times описывала «странные писклявые голоса, такие можно услышать только на фонографе — или в театре марионеток» {282} 282 An Evening With Edison // New York Times. 1878. 6 April.
. Инженер-электрик сэр Уильям Генри Прис полагал, что использовать фонограф для записи выдающихся голосов, например оперной дивы Аделины Патти или великого оратора Глэдстона, — плохая идея {283} 283 Preece W. H . The Phonograph // Journal of the Society of Arts. 1878. Vol. 26. P. 537.
. Пирс считал, что воспроизведенный звук — «это своего рода… бурлеск или пародия на человеческий голос» {284} 284 Thompson E . Machines, Music, and the Quest for Fidelity: Marketing the Edison Phonograph in America, 1877–1925 // Musical Quarterly. 1995. Vol. 79 (1). P. 131–171.
. В наши дни сгенерированный компьютером голос, озвучивающий героя шекспировской пьесы, возможно, описали бы так же. Можно было бы загрузить текст пьесы в современный синтезатор речи, и он, наверное, смог бы выдать членораздельный текст, но странная интонация сделала бы такое воспроизведение карикатурой на актерскую игру.
Возможно, сейчас вы представили себе Стивена Хокинга, играющего Гамлета, но на самом деле Хокинг использовал давно устаревшие технологии. Понятно, что он отказывался «усовершенствовать» свой голос, поскольку он уже стал его визитной карточкой. Новейшие синтезаторы речи, конечно, звучат более естественно, и такие голоса, как Siri, персональный помощник iPhone, для многих людей стали частью повседневной жизни. Когда я приступил к написанию этой главы, в среде специалистов, занимающихся синтезом речи, царило возбуждение по поводу новейшей технологии, разработанной DeepMind. Заголовки пестрели сообщениями о том, как в 2016 году разработанная компанией программа на основе искусственного интеллекта AlphaGo обошла профессионального игрока в го. Ученые старались добиться впечатляющего качества синтезированной речи, как это получилось у DeepMind.
Если мы все ближе подходим к моменту, когда механическая речь станет неотличимой от человеческой, следует ли беспокоиться тем, кто профессионально использует свой голос? Не наступит ли час, когда я в последний раз буду выступать со своей научно-популярной программой на радио BBC? Ведь BBC уже начала переводить и читать сводки новостей на русском и японском языках, используя механические голоса {285} 285 BBC introduces new automatic virtual voiceover translations // BBC. 2015. http://www.bbc.co.uk/mediacentre/latestnews/2016/bbc-russian-virtual-voice-over .
. Это делается для того, чтобы предоставлять услуги на большем количестве языков, так что дикторы-люди не останутся без работы — во всяком случае пока…
А как насчет актеров, которые профессионально используют голос? Некоторые театральные компании уже экспериментируют с роботами-актерами. Конечно, луддиты здесь не нужны, потому что машины не заменяют актеров, а играют самих себя. Например, My Square Lady — опера, в которой робот по имени Мион занят в роли, похожей на историю Элизы Дулитл из мюзикла «Моя прекрасная леди». Элиза занималась риторикой, чтобы изменить свой социальный статус, а Мион учится чувствовать и выражать эмоции, чтобы стать более человечным. По мере того как искусственный интеллект совершенствуется, а компьютерная речь улучшается, будет ли в постановке шекспировской «Как вам это понравится?» звучать модифицированная строка: «Весь мир — театр, а роботы в нем — актеры»?
Говорящие машины появились в театре. Первый настоящий синтезатор речи — механическое устройство, созданное венгром Вольфгангом фон Кемпеленом в конце XVIII века. Кемпелен был настоящим энциклопедистом: политиком, художником, изобретателем и, что самое главное, еще и шоуменом {286} 286 Dudley H., Tarnoczy T. H . The speaking machine of Wolfgang von Kempelen // Journal of the Acoustical Society of America. 1950. Vol. 22 (2). P. 151–166.
. Его самым известным сценическим действом был умеющий играть в шахматы автомат. Эта машина представляла собой большой ящик, на верхней плоскости которого располагалась шахматная доска, а внутри находились замысловатые заводные механизмы, которые тикали и жужжали при движении. Над доской склонился бородатый манекен в турецком халате и чалме, его рука двигалась: он брал фигуры и передвигал их. Это действо вызывало восторг у зрителей по всему миру, включая Париж, где в 1783 году машина сыграла партию с послом США Бенджамином Франклином {287} 287 Davis A . Mechanical chess player baffled crowds for nearly a century // IEEE. 2016.
. Это был Кемпелен-шоумен: он продемонстрировал сложнейший фокус, обманув зрителей, ведь на самом деле все движения контролировались миниатюрным игроком, спрятанным в секретном отделении внутри ящика.

Старинный рисунок машины Кемпелена и модель Брекхейна и Трувейна; воздуходувы не видны, они находятся справа
А вот говорящая машина Кемпелена стала уже серьезным научным предприятием, рожденным желанием опытным путем изучить, как работает голос. Построив машину, которая симулировала отдельные части голосовой анатомии, он надеялся лучше понять человеческую речь. В своей научно-популярной программе я использовал модель машины Кемпелена, которой управлял профессор Дэвид Хауэрд из колледжа Ройял-Холлоуэй при Лондонском университете. Подобно Кемпелену, Дэвид — энциклопедист, инженер по электронике, дирижер и органист. И он тоже немножко шоумен. У говорящей машины Дэвида есть большой набор воздуходувов, которые работают подобно легким. Из них воздух проходит через полую трубку, которая симулирует работу голосовых связок: открывается и закрывается, перекрывая поток воздуха и создавая гудящий звук. Для имитации эффекта голосового тракта из передней части машины высовывается кожаная трубка, которой Дэвид манипулирует для создания разных звуков. Когда воздуходувы, находящиеся под его правой рукой, проталкивают воздух, Дэвид два раза быстро нажимает на кожаную трубку левой рукой, и получается слово «мама» (хотя мне показалось, что эти звуки больше похожи на грустное мычание коровы, чем на голос ребенка). Но когда Фабиан Брекхейн и Юрген Трувейн из Университета Саара в Германии проводили исследования со своей моделью машины Кемпелена, они обнаружили, что четыре из десяти испытуемых, слушавших воспроизводимое машиной слово «мама», думали, что говорит ребенок, а не машина [31] Если вы хотите послушать эту машину, в интернете можно найти несколько видеороликов, в Примечаниях имеются адреса соответствующих сайтов. Интернет-сайты можно найти и для поиска других устройств, которые описаны в этой главе. — Примеч. автора .
{288} 288 См. демонстрационный ролик на: https://youtu.be/k_YUB_S 6Gpo. Эта машина отличается от машины Науэрда, но не слишком сильно. См.: Brackhane F., Trouvain J. What makes «Mama» and «Papa» acceptable? — Experiments with a replica of von Kempelen’s speaking machine // Proceedings of the 8th International Speech Production Seminar. 2008. P. 333–336.
.
Интервал:
Закладка: