Тревор Кокс - Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта
- Название:Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта
- Автор:
- Жанр:
- Издательство:КоЛибри, Азбука-Аттикус
- Год:2020
- Город:М.
- ISBN:978-5-389-17812-0
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Тревор Кокс - Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта краткое содержание
Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Человеческий мозг — это идеальная обучающаяся машина. Мозг младенца состоит примерно из 100 миллиардов нейронов, и каждый нейрон связан приблизительно с 10 000 других. Перед каждым нейроном стоит относительно простая задача. Информация проходит через него в форме электрических импульсов, которые принимаются дендритами — отростками клетки с короткими ответвлениями. Импульсы сочетаются путем сложения или вычитания, в зависимости от того, возбуждающей или тормозящей является связь. Если сложный сигнал превышает определенный порог, нейрон срабатывает и посылает еще один электрический импульс, который стремительно пробегает по нервному волокну, или аксону. Затем этот импульс передается другим нейронам. Именно слаженная работа этих простых нейронов в обширной и сложной сети и делает мозг поразительно мощным.
Ребенок вырабатывает новый навык посредством обучения. Когда отец сидит рядом с дочерью и читает ей книгу, мозг девочки пытается связать звуки, которые она слышит, со словами, которые она видит на странице. Когда малышка начинает читать книгу сама, отец обеспечивает обратную связь, сообщая ей, как она справляется, хвалит ее, если слово прочитано правильно, и деликатно исправляет в случае ошибки. Такое научение вызывает изменение силы, скорости и числа связей между нейронами в мозге девочки. Ребенок учится на успехах и ошибках, так что, когда он будет читать книгу в следующий раз, у него будет больше шансов сделать это правильно.

Два нейрона

Искусственная нейронная сеть
Искусственные нейронные сети пытаются скопировать этот тип поведения. Они тоже сконструированы из большого количества «нейронов», которые способны выполнять простые математические операции. Каждый искусственный нейрон представляет собой несколько строк компьютерного кода, который, подобно своему биологическому эквиваленту, суммирует и обрабатывает входящие сигналы, перед тем как послать результаты другим нейронам сети. Однако эти нейроны не являются точными репликами нейронов мозга, и количество их связей значительно меньше.
Как и ребенок, искусственная нейронная сеть нуждается в обучении. Ученый-компьютерщик выступает в роли суррогатного родителя, снабжая сеть примерами и обеспечивая обратную связь относительно правильности или неправильности принятия решения алгоритмом. Для того чтобы обучить сеть определять настроение в мелодии музыкальной заставки, можно загружать в нее записи, уже четко отмеченные в зависимости от того, какие чувства, радостные или печальные, эта мелодия вызвала у среднего слушателя. Можно догадаться, что пометить вручную тысячи записей — это утомительное занятие. Поэтому мы обратились за помощью к людям и провели онлайн-эксперимент, в котором 15 000 человек прослушивали 144 музыкальные заставки за 60 лет и сообщали нам, какое настроение создавало у них каждое произведение. В процессе обучения компьютер использует обратную связь и оценивает, насколько верно было определено настроение, чтобы изменить силу связей между нейронами. Таким образом, компьютер постепенно улучшает свои расчеты. Обработав достаточное количество примеров, он постепенно научается более точно определять эмоцию, передаваемую музыкальной записью {333} 333 В опубликованной работе о музыкальных заставках использовались методы опорных векторов, а не нейронные сети, потому что нам было интересно, насколько хорошо они будут работать. См.: Mann M., Cox T. J., Li F. F. Music Mood Classification of Television Theme Tunes // International Society of Music Information Retrieval. 2011. P. 735–740.
.
Поскольку искусственная нейронная сеть несравнима по мощности с человеческим мозгом, то загрузка сырого аудиоматериала может ее переполнить. У человека миллиарды нейронов, но даже у самых крупных искусственных сетей их только тысячи. Следовательно, способность компьютера к самообучению тоже ограничена, и поэтому ему лучше упростить задачу. В нашем случае мы загрузили несколько тщательно отобранных характеристик, извлеченных из звуков, а не сырой аудиоматериал {334} 334 Если у вас большие объемы данных и достаточно вычислительных мощностей, можете загружать сырой аудиоматериал в Deep Neural Network и пропустить этап извлечения звуковых характеристик. Однако у нас не было больших массивов данных.
. Зная, что веселая музыка будет, скорее всего, более быстрой, вы можете применить математические формулы для вычисления темпа и ввести эти данные в искусственную нейронную сеть. Еще одним приемом может стать определение аккордов, которые выделяются в произведении, что поможет понять, мажор это или минор, и таким образом, предугадать, будет оно радостным или печальным.
Алгоритм машинного обучения становится таким мощным, потому что, научившись один раз, он приобретает способность делать разумные предположения о музыкальных заставках, которые никогда раньше не слышал. Конечно, система несовершенна и может быть хороша ровно настолько, насколько хороши были загруженные в нее данные. Когда мы расширили поле деятельности и попытались по музыкальным заставкам определить жанр телепрограмм, это вызвало затруднения. Одна из таких проблемных ситуаций — нестройные аккорды грустной заставки к детской программе Noggin the Nog {335} 335 Вы можете услышать эту мелодию на: http://www.televisiontunes.com/Noggin_the_Nog.html .
. Поскольку такая музыка не соответствует оптимистичному сценарию этого жанра, она привела алгоритм машинного обучения в замешательство. Возможно, однако, что она обманула бы и человека!
Таким образом, успех в машинном обучении обычно зависит от определения характерных особенностей, присущих необходимой информации. Чтобы использовать машинное обучение в распознавании лжи, нужно знать, какие характеристики речи могут на нее указывать, и тогда искусственная нейросеть сможет обнаружить обман. Итак, что же выяснили психологи по результатам экспериментов с людьми? Существуют ли явные признаки, указывающие на лжеца?
В январе 1998 года президент Билл Клинтон сделал знаменитое заявление: «У меня не было сексуальных отношений с этой женщиной, мисс Левински». Его речь была натянутой и выдержанной, а каждое слово сопровождалось ритмичным постукиванием указательным пальцем по пюпитру. Семь месяцев спустя президент выступил по национальному телевидению и объявил, что солгал. Контраст между этими двумя выступлениями Клинтона поражает. Его признание вины страстное и беглое, произнесено в знакомом всем стиле, который помог ему стать успешным политиком. Самый резкий контраст между этими речами наблюдается в изменении ритма: второе выступление уже не размеренное, паузы между словами естественным образом варьируются.
Читать дальшеИнтервал:
Закладка: