Тревор Кокс - Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта
- Название:Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта
- Автор:
- Жанр:
- Издательство:КоЛибри, Азбука-Аттикус
- Год:2020
- Город:М.
- ISBN:978-5-389-17812-0
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Тревор Кокс - Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта краткое содержание
Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
7
Берегитесь: у компьютеров есть уши
Сколько еще потребуется времени, чтобы мы перестали отдавать компьютерам ненужные приказы и начали вести с ними осмысленные беседы? Чтобы это произошло, компьютеры должны стать хорошими слушателями. Им придется выйти за рамки алгоритмического декодирования речи и настроиться на тон нашего голоса. Каждый испытывал ужасное чувство, когда любимый человек обижался не на то, что мы сказали, а на то, как мы это сказали. Хорошо это или плохо, но тонкие оттенки голоса могут сказать очень многое: будь то возбуждение, с которым мы рассказываем смешной анекдот, скука от надоевшей беседы или ужас, если мы сообщаем подробности трагедии. Человек, умеющий вести разговор, улавливает эти тонкости независимо от того, чей голос он слышит — человека или микросхемы. Может ли компьютер стать хорошим слушателем?
Самая спорная из всех технологий, позволяющих компьютеру воспринимать речь, связана с распознаванием лжи. Многие из нас почувствуют себя не в своей тарелке при мысли о том, что их разоблачит мощь аналитики, принадлежащая холодной бездушной машине. И все же надежда на то, что технологии помогут отличить правду от лжи, делает технологии исключительно привлекательными для полицейских и политиков, которые стремятся защитить людей от убийц, сексуальных маньяков, финансовых мошенников и других преступников. Детектор лжи стал звездой бульварных телешоу и авторитетным судьей супружеской верности. И все это несмотря на множество примеров, указывающих на несостоятельность данного устройства.
Убийца с Грин-Ривер получил свое прозвище по названию реки к югу от Сиэтла, на берегу которой он в 1980-х и 1990-х годах оставлял тела своих жертв. Одним из инструментов, которым пользовалась полиция во время охоты на серийных убийц, был полиграф. Эта машина проверяет, говорит ли человек правду, опираясь на физиологические признаки, такие как скорость биения сердца, потоотделение и дыхание. В 1984 году Гэри Риджуэй, женатый человек, работавший в окрасочном цехе, добровольно вызвался пройти испытание на полиграфе и успешно его прошел. Девятнадцать лет спустя Риджуэя посадили за решетку за 48 жестоких убийств первой степени, после того как результаты теста ДНК неопровержимо доказали его связь с жертвами этих убийств {329} 329 Levi-Minzi M., Shields M . Serial sexual murderers and prostitutes as their victims: Difficulty profiling perpetrators and victim vulnerability as illustrated by the Green River case // Brief Treatment and Crisis Intervention. 2007. Vol. 7 (1). P. 77.
. Понятно, что полиграф не смог идентифицировать убийцу с Грин-Ривер.

Проверка на детекторе лжи на Клинтонском инженерном заводе, 1944
Научное исследование полиграфа, предпринятое Британским психологическим обществом, показало, что в уголовных делах правильность результатов теста составляет от 83 до 89 %, если он проверяет действительно виновных людей. Но если тест проходит невиновный человек, то правильность результатов составляет от 53 до 78 % от общего числа тестов {330} 330 Party B. W . A review of the current scientific status and fields of application of polygraphic deception detection // British Psychological Society. 2004.
. Несмотря на это, в 2014 году британское правительство ввело обязательную проверку на полиграфе опасных преступников, совершивших сексуальные преступления. Судебные разбирательства показали, что проверка на полиграфе заставляла таких преступников с большей вероятностью признаваться в рискованном поведении, например рассматривании порнографических изображений или знакомстве с детьми. Но на самом деле эти признания не были получены на полиграфе: преступники признавались сами, потому что верили в возможности аппарата разоблачать ложь.
Но если полиграф недостаточно надежен, возможно, мы сможем научить компьютер анализировать речь? Анализ стресса по голосу — это сомнительный метод, используемый страховыми фирмами, полицией и правительственными департаментами для выявления у людей признаков лжи. ABC News утверждает, что этот метод использовался в заливе Гуантанамо и в Ираке, после чего был запрещен Пентагоном {331} 331 Innocent Until Proved Guilty? // ABC News. 2006.
. Компании, которые продают такие системы, не раскрывают секретов их работы, но научные исследования подвергли сомнению их эффективность. Напротив, существуют стандартные способы использования компьютера для восприятия голоса и его последующей интерпретации, и эти способы подробно описаны. Основные подходы уже используются в различных ситуациях — например, автомобиль по затрудненной речи определяет, что водитель пьян, или мобильное приложение предупреждает людей с биполярным расстройством об изменении настроения.
Научить компьютер слушать и понимать речь можно с помощью машинного обучения, когда компьютерную программу учат анализировать запись и извлекать из нее полезную информацию. Некоторые важные вычисления в науке о речи основаны на простых математических формулировках. Если вы хотите узнать, с какой частотой открываются и закрываются голосовые связки, существуют специальные уравнения для получения этой информации по форме звуковой волны. Но если вы хотите узнать о чем-то менее определенном, например не тревожится ли человек о чем-то, то маловероятно, что математические рассуждения принесут результат. В таких случаях компьютерная программа должна на собственном опыте «научиться» опознавать явные признаки тревоги.
Машинное обучение в случае с аудиозаписями может использоваться не только для распознавания речи. Оно применяется при анализе музыки, например для определения жанра — является ли произведение классическим, джазовым, представляет рок-музыку и т. д. В корпорации BBC R&D я занимался исследованием эмоций, которые вызывают музыкальные заставки теле- и радиопрограмм. В архивах BBC хранятся миллионы записей, и корпорация хотела, чтобы каждой из них была присвоена метка с указанием настроения (веселая ли запись, печальная или, наоборот, заряжает энергией), чтобы можно было легко сориентироваться в архиве, отыскивая записи с определенным настроением. Может ли в этом помочь анализ музыкальной заставки? Когда звучат первые радостные аккорды музыкальной заставки к американскому ситкому «Друзья», вы можете догадаться, что это оптимистическая комедия, даже если никогда не смотрели этот сериал. Многие новостные сводки начинаются торжественно, чтобы настроить на серьезный лад. Мы хотели узнать, сможет ли компьютер определять характер музыкальной темы: радостная она или грустная, забавная или серьезная?
Люди научаются соотносить определенные музыкальные характеристики с конкретными настроениями. Темп веселых мелодий, скорее всего, будет более быстрым, и в западной музыке в них часто используется мажорная тональность. Печальная музыка обычно бывает в миноре, в ней музыкальные фразы «стекают вниз», повторяя нисходящую интонацию, которую мы используем, когда сообщаем печальные новости {332} 332 Juslin P. N., Laukka P. Communication of emotions in vocal expression and music performance: Different channels, same code? // Psychological Bulletin. 2003. Vol. 129 (5). P. 770.
. Мы накапливаем подобные ассоциации в течение всей своей жизни, когда слушаем музыку. Алгоритм машинного обучения тоже должен прийти к такому «пониманию», прослушивая огромное количество аудиопримеров. В настоящее время второе рождение переживает один из методов машинного обучения, известный как искусственные нейронные сети. Принцип действия этого метода в общих чертах имитирует структуры мозга.
Интервал:
Закладка: