Журнал Компьютерра - Журнал «Компьютерра» №36 от 04 октября 2005 года

Тут можно читать онлайн Журнал Компьютерра - Журнал «Компьютерра» №36 от 04 октября 2005 года - бесплатно полную версию книги (целиком) без сокращений. Жанр: Прочая околокомпьтерная литература. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.

Журнал Компьютерра - Журнал «Компьютерра» №36 от 04 октября 2005 года краткое содержание

Журнал «Компьютерра» №36 от 04 октября 2005 года - описание и краткое содержание, автор Журнал Компьютерра, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru

Журнал «Компьютерра» №36 от 04 октября 2005 года - читать онлайн бесплатно полную версию (весь текст целиком)

Журнал «Компьютерра» №36 от 04 октября 2005 года - читать книгу онлайн бесплатно, автор Журнал Компьютерра
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

ТЕМА НОМЕРА: О пользе разговоров

Честно говоря, я нахожусь в некотором затруднении, потому что тема, которая несколько месяцев назад виделась мне самой простой из всей серии про интерфейсы, неожиданно оказалась самой сложной. И, в общем-то, получилась совсем о другом.

Дело в том, что третью тему мы планировали посвятить диалоговым (conversational) или даже мультимодальным (поскольку использование новых подходов вовсе не исключает полезность старых) интерфейсам. Переход от GUI к свободному общению с компьютером представляется вполне естественным: во-первых, большинству из нас проще высказать свою мысль вслух, чем записать ее. Во-вторых, современные компьютерные интерфейсы (GUI и командная строка) задают пользователю жесткие ограничения, которых можно было бы избежать, научив компьютер понимать нас «с полуслова».

Так, к примеру, можно было бы, валяясь на диване, приказать компьютеру запустить MP3-проигрыватель с нужной песней. Или попросить найти в сетевой библиотеке интересные книжки - «выбери, мол, на мой вкус» (на основании анализа загруженных ранее книг). Или, чуть продрав глаза, уточнить у Outlook список встреч на сегодня.

Мы, конечно, понимали, что многие из этих задач решить непросто, но в последние лет пять о диалоговых интерфейсах писали так уверенно, что, казалось, будто они появятся не сегодня-завтра. Смущало лишь то, что никаких принципиальных прорывов в базовых технологиях, которые необходимы для построения такого рода интерфейсов (синтез и распознавание речи, понимание компьютером естественного языка, умение поддерживать диалог) за те пять лет не произошло. Но если все действительно так, зачем тратить силы и время на разработку интерфейсов, которые невозможно воплотить во всей полноте? Разумно ли обсуждать интерьер, если еще и фундамент не достроен?

Как выяснилось, многие из разработчиков не склонны отвлекаться на такие мелочи, как отсутствие или отставание ключевых технологий. Может, они и правы. В конце концов, в таком деле, как проектирование интерфейсов, есть масса тонких моментов, никоим образом не привязанных к конкретной реализации. В общем, проектировщикам диалоговых интерфейсов есть чем заняться. Но нас больше интересует, в каком состоянии находятся сегодня технологии, без которых построить диалоговый интерфейс не удастся.

Или - когда компьютер, наконец, научится слушать, говорить и понимать.

Ничего никому не скажу?

Первым нагнулся к уху головы сам дон Антоньо; он спросил ее тихо,

но так, однако же, что все его услышали:

- Заклинаю тебя, голова, волшебною силою, в тебе заключенною:

скажи мне, какие у меня сейчас мысли?

И голова, не разжимая губ, ясно и отчетливо,

так, что все ее расслышали, ответила ему:

- Мыслей я не читаю.

При этих словах все обмерли, особливо когда удостоверились,

что во всей комнате, а равно и возле самого столика с волшебною головою,

нет живой души, которая могла бы за нее ответить.

Мигель де Сервантес Сааведра, «Хитроумный идальго Дон Кихот Ламанчский»

Прежде чем описывать состояние технологий, важных для построения диалоговых интерфейсов, отметим, что все интересующие нас направления разработок - «невезучие». На каждое из них в свое время возлагались большие надежды, которым не суждено было сбыться. У каждого есть своя собственная сверхзадача, которая до сих пор не решена (и неизвестно, будет ли решена в обозримом будущем). Тем не менее исследования в этих областях нельзя считать тупиковыми или бессмысленными. Они не только дали множество полезных побочных результатов. Ключевые технологии тоже вполне работоспособны и востребованы - просто не так широко, как предполагалось вначале.

Впрочем, синтез речи в нашей защите не нуждается. Это, пожалуй, самая состоявшаяся и распространенная из речевых технологий. Возможно, потому, что у нее самая долгая история.

Первые «говорящие машины» пытались делать еще в XII-XIII веках, однако в Европе тех времен подобная деятельность рассматривалась как еретическая, все опытные образцы безжалостно уничтожались, и ни одно достоверное описание подобной машины до наших дней не дожило. Тем не менее молва широко разнесла слухи об успешных экспериментах Альберта Великого и Роджера Бэкона, спровоцировав шутников всех мастей на создание фальшивых «говорящих голов». Чудесные устройства представляли собой хитроумные механизмы, «отвечающие» на вопросы слушателей (на самом деле, отвечал на вопросы человек, который был либо спрятан в самом устройстве, либо находился в соседней комнате, вещая с помощью сложной системы труб). С одной из таких конструкций и встретился герой знаменитого романа Сервантеса.

В конце XVIII века конструкторы научились делать настоящие «говорящие машины», механически имитируя человеческий голосовой аппарат. Правда, считать издаваемые ими звуки «речью» можно с натяжкой. Так, представленные в 1770 году Санкт-Петербургской Академии резонаторы Кратценштайна могли произнести лишь пять гласных звуков. В арсенале построенной спустя двадцать лет машины фон Кемпелена было уже двадцать согласных, что теоретически позволяло оператору «произносить» целые фразы. Но вот понимал ли их кто-то, кроме изобретателя, - вопрос. По чертежам это не определишь, но достаточно сказать, что даже электронный синтезатор Voder, показанный на Нью-Йоркской торговой выставке 1939 года, «говорил» крайне невнятно (звуковые примеры можно послушать в сети: www.cs.indiana.edu/rhythmsp/aSa/parta.html.

Если оператор Voder’а должен был управлять устройством в реальном времени (что совсем не просто - на обучение операторов уходило несколько месяцев), то сегодняшние электронные системы синтеза речи в операторе не нуждаются, поскольку заняты чтением заранее подготовленных текстов. Их так и называют - системы TTS (text-to-speech).

В силу вышесказанного любая современная электронная система синтеза речи состоит из двух основных блоков. Первый отвечает за преобразование орфографического представления в фонетическое - ведь, как правило, слова пишутся не так, как слышатся, и больше того: зачастую прочтение того или иного слова регулируется не правилами языка, а сформировалось исторически (почти как в анекдоте про «вильку» и «тарельку», которые пишутся без мягкого знака и понять это невозможно, нужно запомнить). Кроме того, система осуществляет синтаксический (а иногда и семантический) анализ предложения для того, чтобы верно расставить интонационные акценты (просодическое оформление). В результате на выходе мы имеем подробнейшую инструкцию, как нужно читать предложение.

Описанное преобразование зависит в большей степени от языка и во всех системах реализуется примерно по одним и тем же принципам. А вот когда дело доходит непосредственно до синтеза речи, возможностей для маневра у разработчиков гораздо больше.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Журнал Компьютерра читать все книги автора по порядку

Журнал Компьютерра - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Журнал «Компьютерра» №36 от 04 октября 2005 года отзывы


Отзывы читателей о книге Журнал «Компьютерра» №36 от 04 октября 2005 года, автор: Журнал Компьютерра. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x