Владимир Алпатов - Языкознание: От Аристотеля до компьютерной лингвистики
- Название:Языкознание: От Аристотеля до компьютерной лингвистики
- Автор:
- Жанр:
- Издательство:неизвестно
- Год:2015
- ISBN:9785961450842
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Владимир Алпатов - Языкознание: От Аристотеля до компьютерной лингвистики краткое содержание
Языкознание: От Аристотеля до компьютерной лингвистики - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Однако в конце XIX в. и еще больше в XX в. прикладная деятельность лингвистов и ученых смежных специальностей (например, психологов и физиологов речи) значительно расширилась, и это расширение продолжается. В разных главах книги говорилось о конструировании алфавитов, лечении речевых расстройств, методах речевого воздействия, в том числе в пропаганде и рекламе, и др. Некоторые виды этой деятельности существовали давно, но развивались стихийно. Теперь же они получили научную базу.
Заметно расширились прикладные фонетические исследования. Если Реформатский в 1970 г. среди областей практического применения фонетики упоминал лишь технику связи, то в наши дни разрабатываются многие виды речевых технологий. Вот перечень некоторых из них в уже упоминавшемся учебнике Кодзасова и Кривновой: «…создание человеко-машинных интерфейсов с устным вводом / выводом информации; речевое управление компьютером и другими техническими устройствами… организация информационно-справочной службы, позволяющей получать и выдавать различную информацию из базы данных в условиях, когда вопрос задается голосом… создание устройств для приема и озвучивания различных сообщений… многоязычный устный ввод / вывод речевой информации с автоматическим переводом; разработка приспособлений и компьютерных систем для помощи инвалидам… создание "автоматической машинистки"… озвучивание корректур и исправление орфографических ошибок; помощь в обучении иностранному языку (автоматические фонетические тренажеры)». Если для конструирования алфавитов классической фонологии было достаточно, то перечисленные задачи могут решаться лишь на основе экспериментальных методов.
Но особое значение с середины ХХ в. получили разного рода прикладные исследования, так или иначе связанные с общением человека и вычислительной машины. Данная область исследований получила название компьютерной, или вычислительной, лингвистики. Самая известная даже среди неспециалистов, хотя далеко не самая массовая область работ такого рода — создание систем автоматического (машинного) перевода.
Уже вскоре после появления в 1940-е гг. электронно-вычислительной техники начались первые попытки такого рода. Впервые эксперимент в этой области состоялся в США в 1954 г. и охватывал 250 слов, а в СССР его провели годом позже. Поначалу задача автоматического перевода рассматривалась как в основном техническая, в США она разрабатывалась инженерами без участия лингвистов, но затем выяснилось, что их привлечение также необходимо. В нашей стране лингвисты, в том числе Мельчук, участвовали в разработках с самого начала.
В 1950-х гг. и начале 1960-х гг. исследователи еще не представляли себе всей сложности задачи. Казалось, что достаточно ввести в машинную память двуязычный словарь, и машина сможет каждому слову на входе приписывать на выходе его переводной эквивалент. То есть системы производили пословный перевод. Однако выяснилось, что таким образом нужные практические результаты не могут быть получены прежде всего из-за проблемы неоднозначности реальных предложений любого языка. Уже на морфологическом уровне, например, в русском языке мы видим значительную омонимию. Форма двери может быть формой пяти падежей: родительного, дательного, предложного падежей единственного числа, именительного, винительного падежа множественного числа. Разумеется, носители языка снимают омонимию благодаря контексту, но машина этого сделать не может, если ей не задать алгоритм морфологического анализа. Еще больше неоднозначности в синтаксисе. Разработчики первых советских систем машинного перевода приводили такую фразу с несколькими видами неоднозначности: Недовольство рабочих бригад вызвало осуждение товарища Иванова . Или вот строка из стихотворения: Педагог в руках с указкой . Взрослый носитель языка даже при нестандартном порядке слов поймет, что речь идет об учителе, который держит указку. Но возможно и другое прочтение, более соответствующее порядку слов: некто держит учителя и указку. Но это заметит разве что ребенок, у которого еще не выработался автоматизм синтаксического анализа. А как это распознавать машине? Оказался необходимым и синтаксический анализ. А многие случаи требовали и обращения к семантике.
К 1960-м гг. выяснилось, что помимо собственно перевода необходимыми процедурами являются механизмы анализа исходного языка и синтеза языка, на который осуществляется перевод. Механизмы анализа и синтеза могут не быть жестко привязаны к одной конкретной системе и использоваться для разных систем, в которых участвует данный язык. Между структурами входного и выходного языков в систему включался так называемый язык-посредник, на который после анализа переписывался входной язык и с которого затем проводилась запись на выходной язык. Такие системы назывались системами второго поколения.
В отличие от грубых систем пословного перевода, мало связанных с собственно наукой о языке, разработка анализа и синтеза требовала решения многих теоретических вопросов лингвистики. Выше уже не раз говорилось о том, что начало второй половины ХХ в. проходило в лингвистике (структурной, затем генеративной) под знаком формализации и математизации. Научные поиски, связанные с формальной лингвистикой, стимулировались прикладными задачами. При разработке систем машинного перевода постоянно оказывалось, что достигнутый к тому времени уровень формализации недостаточен для эффективного машинного анализа и синтеза, а это требовало разрабатывать и лингвистические проблемы. При этом уровень теоретичности в США и СССР был неодинаков. Американские лингвисты, вместе с инженерами занимавшиеся машинным переводом, не отличались интересом к разработке лингвистической теории. Чаще лингвисты старались применить на практике влиятельные теоретические идеи, однако, несмотря на огромное влияние идей Хомского, они почти ничего не дали для машинного перевода и других областей компьютерной лингвистики. Больше для этого оказались пригодны концепции лингвистов, работавших вне хомскианской парадигмы, таких как Чарльз Филлмор (1926–2014). В СССР ситуация была иной: Мельчук, Апресян и другие лингвисты-теоретики активно занимались машинным переводом и прочими прикладными проблемами, между направлениями их деятельности была двусторонняя связь.
Первая половина 1960-х гг. была периодом больших ожиданий в отношении автоматического перевода, что нашло отражение даже в художественной литературе. Вот ранняя повесть братьев Стругацких «Попытка к бегству» (1962), где люди из коммунистического общества XXIII в., один из которых лингвист, попадают на чужую планету, и перед ними встает проблема общения с инопланетянами, которую лингвист, разумеется, успешно решает. Ему удается произвести дешифровку и разработать систему машинного перевода на язык внеземной цивилизации и наоборот. Разумеется, было естественно полагать, что деятельность, казавшаяся реализуемой в ближайшем будущем, через три столетия станет рутиной.
Читать дальшеИнтервал:
Закладка: