Анатолий Анисимов - Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык
- Название:Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык
- Автор:
- Жанр:
- Издательство:Наукова Думка
- Год:1991
- Город:Киев
- ISBN:5–12–001952–8
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Анатолий Анисимов - Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык краткое содержание
На основе алгоритмического анализа исследуются литературное творчество, структуры естественного языка и мышление человека. Системный подход применяется для анализа мифов, лингвистических схем, снов, предложений и систем искусственного интеллекта. Особое внимание уделяется рекурсии как специальному алгоритмическому способу организации сложных систем. Рассматриваются примеры рекурсии в литературе, языке, в формировании психической деятельности человека.
Для широкого круга читателей, интересующихся современными достижениями информатики, лингвистики и искусственного интеллекта.
Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
Таким образом, управляющее пространство предложения строится как система вложенных структур, состоящих из точек с а — р-связями между ними и содержащих внутри себя части предложений, образующих определения или линейные конструкции. Структура управляющих пространств отражает фундаментальное свойство языка порождать отношения и распространять их на соответствующие элементы.
Управляющие связи деревьев подчинения автоматически восстанавливаются из структуры а — (J-связей. Структура управляющего пространства дает более тонкую классификацию управляющим связям.
В предложениях без нарушений свойства проективности (т. е. без пересечения определений разных элементов) элементы, вложенные в точку, образуют систему составляющих. В этом смысле структура управляющее пространство одновременно обобщает и деревья подчинения, и системы составляющих. Также ясно, что управляющее пространство учитывает разрывные словосочетания, а слова, входящие в одну точку, образуют синтаксическую группу в смысле Гладкого.
Управляющее пространство предложения не связано с его последовательным порядком записи и отражает только семантику порождения и передачи отношений. Значит, структура управляющего пространства не зависит от конкретного языка и только ее трансляция в линейную запись определяется синтаксисом конкретного языка. Поэтому управляющие пространства являются хорошим кандидатом на промежуточную форму представления в системах автоматического перевода.
Заметим, что рассмотрение линейных конструкций и определений для представления синтаксических структур традиционно в лингвистических исследованиях. В том или ином ограниченном виде они часто встречаются в литературе: предикаты и синтагмы в классической лингвистике, управление и примыкание, актантное и атрибутивное отношения, отношения в ПРОЛОГ-системах обработки естественного языка. Выразительные средства модели управляющих пространств дают новую наглядную характеристику этим отношениям, учитывают управляющие и иерархические связи между группами словосочетаний и, кроме того, ориентированы иа конкретную технологию рекурсивно-параллельного программирования.
При обработке синтаксических структур естественного языка возникают две основные задачи — анализ и синтез. Задача анализа — по линейной записи текста построить соответствующее управляющее пространство, задача синтеза — по управляющему пространству построить соответствующую линейную последовательность связного текста. Вторая задача, вообще говоря, проще. При отображении линейной зависимости в текст алгоритм синтеза следует последовательности а — р-связей. При синтезе текста из определений алгоритм сначала решает вопрос, что выдается раньше — определяемый объект или его уточнение. Затем происходит выдача текста из соответствующих конструкций, образующих определение. В алгоритме анализа идет многократная свертка определений и выделение линейных зависимостей.
В программной реализации модели управляющих пространств предложений а — (J-связи реализуются как каналы в ПАРУС-системе программирования. В точках размещаются алгоритмические модули, задающие слова, их характеристики и связь с семантическими базами. По а — (J-каналам осуществляется необходимый обмен информацией для выбора необходимой синтаксически правильной формы частей речи. Разрабатывается экспериментальная версия генерации и анализа предложений русского языка. Отметим, что ПАРУС-технология ориентирована на применение в высокопроизводительных параллельных вычислительных комплексах. Поэтому предлагаемый подход допускает эффективную параллельную реализацию.
Интересна реализация управляющих пространств человеческим мозгом. Нейроны легко соединяются в переплетенные ансамбли, образуя сложные иерархические комплексы. В такой структуре нервное возбуждение может передаваться однонаправленно. Это соответствует реализации линейных а — (J-связей. Нейроны также способны образовывать замкнутые кольцевые реверберирующие цепи, в которых может долго, без затухания циркулировать электрический сигнал. На этом принципе основана кратковременная память. Как раз циклические цепи и нужны для образования замкнутых а — р-циклов. Таким образом, мозг может топологически, один к одному, моделировать управляющие пространства и строить причудливые картины мысли.
В мозге есть две особые речевые зоны — Брока и Вернике. У большинства людей обе они расположены в левом полушарии. Зона Вернике отвечает за сопоставление слов образам. Она работает с семантическими сетями памяти и отвечает за построение управляющего пространства, что соответствует пониманию речи. Зона Вернике связана дугообразным пучком волокон с зоной Брока. Последняя отвечает за анализ и синтез грамматических схем. В зоне Брока управляющее пространство транслируется в линейные последовательности речевых предложений. Эти принципы могут лечь в основу схемы нейрокомпьютера, понимающего речь.
Управляющие пространства можно использовать для получения стилистических характеристик отдельных текстов и авторов. Например, в предложении можно просчитывать количество циклических а — р-цепей, линейных соединений, глубину вложенности определений, вложенность по линейным конструкциям, другие особенности строения управляющего пространства предложений. Интересные функциональные характеристики стиля дает линейная конфигурация текста, построенная по VII. В этом случае текст графически изображается колебательной структурой, отражающей иерархию подчиненных предложений.
В отличие от классической стилеметрии, где ведется статистический учет только линейных параметров текста — частота появления тех или иных частиц, слов, междометий и т. д., в рассматриваемом случае учитывается топология мысли, ярко выражающая индивидуальные особенности мышления. Вот несколько характерных предложений В. Набокова из автобиографической прозы «Другие берега».
1. «Снег — настоящий на ощупь; и когда наклоняюсь, чтобы набрать его в горсть, полвека жизни рассыпается морозной пылью у меня между пальцев».
2. «От морского ветра губы становились солеными: пляж трепетал как цветник, и безумно быстро через него проносилась залетная бабочка, оранжевая с черной каймой».
3. «Люди неумные, с большими способностями к математике, лихо добираются до тайных сил природы, которые кроткие, в ореоле седин, и тоже не очень далекие физики предсказали (к тайному своему удивлению)».
4. «В чистоте и пустоте незнакомого часа тени лежали с непривычной стороны, получалась полная перестановка, не лишенная некоторого изящества, вроде того, как отражается в зеркале у парикмахера отрезок панели с бесконечными прохожими, уходящими в отвлеченный мир, — который вдруг перестает быть забавным и обдает душу волною ужаса». [117] 117 Набоков Вл. Другие берега//Дружба народов. — 1988.— № 6,—С. 77, 93, 131, 132.
Интервал:
Закладка: