Изот Литинецкий - Беседы о бионике
- Название:Беседы о бионике
- Автор:
- Жанр:
- Издательство:неизвестно
- Год:1968
- ISBN:нет данных
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Изот Литинецкий - Беседы о бионике краткое содержание
Беседы о бионике - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
А пока? А пока каждый ученый, работающий над созданием устройств по автоматическому распознаванию речи, идет избранным им путем.
Для проверки того или другого принципа автоматического распознавания речи ученые обычно строят фонетограф. Его блок-схема выглядит так: микрофон — усилитель — распознающееустройство — электрическая пишущая машинка. Появление фонетографов навело ученых на такую мысль: а что, если использовать это устройство в качестве самой обыкновенной пишущей машинки? Диктовать в микрофон текст доклада или научной статьи и получать на выходе тот же текст отпечатанным? Так сказать, автоматизировать труд машинисток или стенографисток, а может быть, и работу типографских наборщиков. Такой аппарат мог бы оказать неоценимую услугу также сотрудникам вычислительных центров. Они смогли бы вводить данные в вычислительную машину, просто диктуя их в микрофон.
Небезынтересно отметить, что возможность создания автоматического стенографа — пищущей машинки была доказана еще в начале сороковых годов советским ученым профессором Л. Л. Мясниковым, построившим динамический анализатор — прибор для объективного распознавания звуков речи. Однако реализация этой идеи была отложена из-за начавшейся Великой Отечественной войны.
Над созданием пишущих машинок-автоматов, печатающих под диктовку, ныне работают ученые ряда стран. Можно проектировать машинки, печатающие с голоса, для печатания слов, слогов, букв или звуков (фонем). По сложности конструкции и трудоемкости изготовления эти устройства очень разнятся. Так, для словесных машинок требуется очень большая память и само печатное устройство получается сложным и громоздким. Зато чисто фонетическая машинка должна содержать в памяти около 40 знаков и иметь столько же печатных знаков. Но такие устройства обладают чрезвычайно существенным недостатком: для чтения напечатанного материала требуется определенный навык, так как фонетографы дают на выходе фонетическую запись, т. е. значки, соответствующие звукам речи, а не буквам продиктованного текста, — своего рода транскрипцию. Почему же они непохожи друг на друга?
Дело в том, что произносимые звуки не соответствуют буквам русского алфавита. Сорока фонемам русской речи соответствуют 33 буквы алфавита. Помимо того, что в нашем алфавите есть непроизносимые буквы (ь, ъ), но и пишем-то мы часто совсем не то, что слышим. Произнесите, например, слово "лоб". На конце отчетливо слышится "п". Но если вы напишите так, как слышите, вас сочтут неграмотным.
Займись наши ученые проблемой распознавания речи не 15 — 20 лет назад, а во времена Кирилла и Мефодия — положение было бы совсем другим. И вот почему. 13 веков назад Кирилл и Мефодий создали русскую письменность, в которой каждому звуку соответствовала буква. Но за прошедшие 1300 лет в нашем произношении произошли большие изменения, а эволюция фонетической системы языка не получила достаточного отражения в письменной речи. Вот и получается описанная выше ситуация.
Как же заставить фонетическую машинку выполнять работу по перекодированию звуков в буквы подобно тому, как это делает пишущая под диктовку машинистка? Да и возможно ли это вообще? Возможно. Перевод звуков речи в буквы должен происходить в соответствии с грамматическими, орфографическими и лексическим:и правилами. Для ЭТОГО машинка должна быть наделена "памятью" на определенное количество звуков, сочетаний или слогов. Отсюда, конечно, не следует, что в памяти машинки должны быть заложены все звукосочетания, вполне достаточно иметь наиболее ходовые и типичные звукосочетания, при произнесении которых возможен неточный перевод звуков в буквы. Очень редких сочетаний или сочетаний, легко распознаваемых машинкой, может в памяти и не быть, так как это не вызовет трудностей в чтении материала и легко может быть исправлено в процессе чтения.
Примером удачного решения задачи является фонетическая пишущая машинка, созданная американскими учеными Г. Олсоном и Г. Беларом. Общий вид ее конструктивного оформления показан на рис. 6.
Блок-схему всего устройства можно рассматривать как сложный аналог слухового аппарата, части мозга, нервной системы и нервно-мышечного аппарата человека, печатающего под диктовку. Бионическая схема человека, печатающего под диктовку, и блок-схема фонетической пишущей машинки показаны на рис. 7. Чтобы понять принцип работы устройства, проследим, каким образом перерабатывается звуковая информация по пути ее следования.
Звуковая энергия улавливается наружным ухом человека, передается по слуховому проходу и воздействует на барабанную перепонку среднего уха. Механическое движение последней передается жидкости, заполняющей улитку (внутреннее ухо), при помощи слуховых косточек, которые, подобно рычажкам, перемещаются нелинейно. При этом происходит "компрессия" ("сжатие") сигнала, т. е. большие амплитуды уменьшаются сильнее, чем малые, причем уменьшение амплитуды пропорционально ее величине.
Рис. 6. Общий вид фонетической пишущей машинки (модель III), разработанной Г. Олсоном и Г. Беларом
На рис. 7 показано схематическое изображение "развернутой" улитки и показаны частоты, воспринимаемые различными ее участками. Здесь осуществляется первичный анализ информации. Дальнейший ее анализ происходит в мозге, куда сигналы поступают по слуховому нерву. На основе этого анализа мозг вырабатывает команды, посылаемые мышцам руки, нажимающей на соответствующие клавиши пишущей машинки.
В машине, распознающей речь, голос оператора воспринимается микрофоном и преобразуется в электрические колебания соответствующих частот. Желательно, чтобы результаты распознавания не зависели от громкости произносимых слов и расстояния от микрофона. Для этой цели в машине применен звуковой компрессор, представляющий собой специальный нелинейный усилитель, который хорошо имитирует работу среднего уха.
После усиления и компрессии речевой сигнал поступает на анализатор частот — систему из восьми полосовых фильтров, охватывающих диапазон 250-10 000 гц, и систему детекторов сравнения амплитуд. Последняя собрана так, что реле, соответствующее данному каналу, включается лишь тогда, когда уровень в нем больше среднего уровня в двух соседних каналах. Выходной сигнал частотного анализатора поступает в виде двоичного восьмиразрядного кода в корректированную по времени "спектральную память". В ней запоминаются состояния восьмиканальных реле в течение пяти последовательных интервалов времени. Образующаяся матрица 5X8, соответствующая произнесенному слогу или слову, считывается устройством распознавания комбинации сигналов лишь тогда, когда вся матрица будет полностью образована.
Читать дальшеИнтервал:
Закладка: