Коллектив Авторов - Цифровой журнал «Компьютерра» № 186

Тут можно читать онлайн Коллектив Авторов - Цифровой журнал «Компьютерра» № 186 - бесплатно полную версию книги (целиком) без сокращений. Жанр: Прочая околокомпьтерная литература. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.

Коллектив Авторов - Цифровой журнал «Компьютерра» № 186 краткое содержание

Цифровой журнал «Компьютерра» № 186 - описание и краткое содержание, автор Коллектив Авторов, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
ОглавлениеКолонка

От бондианы до мистификации: уроки толстого «Сигги» Автор: Сергей Голубицкий

Ряд соображений о мотивации детей индиго на службе Органов Автор: Сергей Голубицкий

Мыслеобмен и охота к перемене мест Автор: Василий Щепетнёв

Голубятня: Очарование и ужас идеального мира Автор: Сергей Голубицкий

Двойной блеф светлого будущего, которого не будет Автор: Сергей Голубицкий

Старина Икан, Apple и пропасть на горизонте Автор: Сергей Голубицкий

Голубятня: Страда расставаний и счастливых открытий Автор: Сергей Голубицкий

Культурно адаптирующиеся оппортунисты, или О разнообразии экологических ниш <em>Homo sapiens</em> Linnaeus, 1758 Автор: Дмитрий Шабанов

IT-рынок

(DZ) Давид Ян: «Я думаю, что люди, которые толкают науку и бизнес вперёд, в определённой степени безумны» Автор: Компьютерра

Младший брат «Айфона»: какими будут iPhone 5S и 5C Автор: Андрей Письменный

Жива ещё моя старушка! Почему Windows XP до сих пор ТАК популярна Автор: Евгений Золотов

Рубежи e-commerce: к каким «контрольным цифрам» стоит стремиться отечественной электронной коммерции? Автор: Михаил Ваннах

Промзона

Очки, похожие на Google Glass, позволяют управлять планшетом так, как если бы он висел в воздухе Автор: Николай Маслухин

Эти кристаллы способны впитывать воды в 500 раз больше собственного веса и позволяют консервировать ее впрок Автор: Николай Маслухин

Странное будущее: костюм для симбиоза человека и водорослей Автор: Николай Маслухин

Reebok выпустила датчик ударов по голове для спортсменов Автор: Николай Маслухин

Автомобильный Foursquare от Volkswagen: приложение будет отмечать ваши поездки и выдавать значки достижений Автор: Николай Маслухин

Технологии

Серебряная пуля: Элон Маск раскрыл секреты Hyperloop Автор: Евгений Золотов

Искусственная кожа: как научить роботов чувствовать и зачем это делать Автор: Андрей Васильков

Криптопочта Эдварда Сноудена и контратака на правительство Гехана Гунасекары: история продолжается! Автор: Евгений Золотов

Даёшь киношку: материализация магнитных вихрей-скирмионов может пригодиться при переходе на видеоформат 4К Автор: Михаил Ваннах

Самодостаточная коммуникация: без проводов и батарей Автор: Андрей Васильков

Почему социальная сеть Google+ лучше, чем Facebook: восемь очевидных преимуществ Автор: Олег Нечай

Циферкой ошиблись! Как мелкий баг в софте поставил подножку всему миру Автор: Евгений Золотов

Семь ненужных и даже вредных функций Facebook, которых не должно существовать Автор: Олег Нечай

Навигация 2.0: как обманывают GPS и восстанавливают истину Автор: Андрей Васильков

С Тором шутки плохи: как поймали Эрика Маркеса и почему не слышно критиков РПЦ? Автор: Евгений Золотов

Гид

Quip — современный текстовый редактор для мобильных пользователей Автор: Андрей Васильков

Российский сервис Yep поможет найти интересного человека в любое время Автор: Михаил Карпов

Цифровой журнал «Компьютерра» № 186 - читать онлайн бесплатно полную версию (весь текст целиком)

Цифровой журнал «Компьютерра» № 186 - читать книгу онлайн бесплатно, автор Коллектив Авторов
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать
Вначале мы с Сашей хотели просто заработать по пять тысяч рублей на переводе - фото 37

Вначале мы с Сашей хотели просто заработать по пять тысяч рублей на переводе бумажного словаря в электронную форму — и, довольные (при стипендии в 55 рублей такие деньги казались огромными), разойтись. Но оказалось, что даже вдвоем реализовать этот проект крайне сложно. Нужно было не только разработать собственно программу для ПК, но также найти финансирование под создание контента, а затем — людей, которые подготовят этот самый электронный контент по нашей спецификации, исправить все ошибки, выпустить документацию, упаковку… и в конце концов кому-то этот контент продать. Про реализацию такого проекта в одиночку не могло быть и речи… Повторю, даже вдвоём это было предельно сложно. Сегодня я не очень понимаю, как нам удалось всё это сделать за девять месяцев :-).

Д. З.Получается, ваша логика была такая: «Это неподъёмно — значит, мы нанимаем много людей, а я разработкой продукта сам детально не занимаюсь»?

Д. Я.Это сегодня в ABBYY работает 2 000 человек и офисы в 14 странах… А в 1989 году «много людей» — это Саша Москалёв и я. Саша один в первые полтора года заменял десятерых: аналитика, интерфейс-дизайнера, графического дизайнера, архитектора, инженеров по базе данных, оболочке, резидентной программе, инсталятору, системе защиты, тестера, выпускающего QA инженера и пр.

Мы понимали, что нужно писать резидентную программу, которая позволила бы сделать словарь, «всплывающий» поверх окон Word или Excel и показывающий на экране перевод. TSR-программирование, надо сказать, тогда казалось чем-то фантастичным: эта техника толком нигде не была описана, книжек о ней почти не было (помню, первые из них появились в Доме научно-технической книги на Ленинском проспекте), знания передавались фактически из уст в уста.

Д ЗРезидентное программирование всегда было на грани фола формально ведь - фото 38

Д. З.Резидентное программирование всегда было «на грани фола»: формально ведь этим заниматься было нельзя, по спецификациям MS DOS это было запрещено. Только некоторые инструменты внутри операционной системы позволяли резидентным программам переключать на себя обработку прерываний — и эти механизмы не были нигде задокументированы, их опытным путём обнаруживали отдельные люди. Я лично хорошо помню, что мы, наблюдая за работой таких «гуру», часто слышали просьбу: «А теперь, пожалуйста, отвернитесь». Всё было именно на таком уровне неизвестности. И достичь того, чтобы резидентные программы работали «без запинки», было действительно чем-то из области фантастики.

Д. Я.Сейчас мы продолжаем заниматься «магией» — только теперь в иной плоскости. Теперь эта «ворожба» посвящена поиску способов вычленить факты из естественного языка.

Д. З.Есть мнение, что такой подход, как «интерлингва» (вычленение смысла из фразы на одном языке, а затем перевод этой мысли на другой язык), в принципе неправилен. Как относиться к таким суждениям? Я знаю много людей, которые идеально владеют двумя иностранными языками (или языками программирования): они используют именно технику интерлингвистики. Но ведь семантика — это всегда сумма коммуникации в данный момент и коммуникативного опыта. А у программы такого опыта нет…

Д. Я.В разных культурах существует большая часть пересекающихся языково независимых понятий, которые укладываются в определённую иерархию. Существует множество академических исследований и проектов по этому поводу, а коммерческих попыток свести все понятия языка к универсальному дереву понятий и использовать его совместно с синтаксисом языка и статистикой не было.

Фактически это иерархия с собранными в ней сущностями, между которыми есть отношения близости. Одни из них — родительские, другие — дочерние; это деление образует основную структуру. Если наполнить основную «ёлку» иерархии массой существующих в языке семантических классов, то любой новый класс сможет занять чёткое место в этой системе. Качество «пристраивания» нового элемента при этом определяется минимумом новых связей, которые будут необходимы, чтобы покрыть все возможности применения этого концепта в реальном мире. Скажем, для концепта «зрелость» соседствующими элементами будут «зрелый»/«незрелый», «зелёный»/«перезрелый», «гнилой» и так далее.

То есть в системе заложены главным образом связи между понятиями смысловой - фото 39

То есть в системе заложены главным образом связи между понятиями смысловой близости. Кстати, в нашей команде работают люди, мыслящие на нескольких языках; с ними мы пытаемся анализировать параллельные тексты. При этом мы стараемся вычленить из этой естественной формы языка все наблюдаемые семантические классы, отнести наиболее конкретные из них на более низкие уровни, более общие — на верхние ступени иерархии. Например, семантический класс «средство передвижения» расположен выше классов «наземный транспорт», «воздушный транспорт» и «другой транспорт». Конечно, выстраивание таких цепочек — творческий процесс. Скажем, есть множество возможностей для встраивания в иерархию омонимов: «тополь» — это ведь и растение, и средство вооружения. Собственно говоря, из-за большого числа значений каждого слова в системе семантических категорий так много горизонтальных связей.

В целом работа системы включает ряд сложных этапов: лексико-морфологический анализ, грубый и точные синтаксический анализ, семантический анализ, синтаксический синтез, синтез линейного порядка и, наконец, морфологический синтез. Не буду вдаваться в подробности, и без того очевидно, что задача очень сложная — и именно потому очень многие считают интерлингвистические подходы невозможными…

Д ЗНо ведь это как спор математиков и инженеров первым решение кажется - фото 40

Д. З.Но ведь это — как спор математиков и инженеров: первым решение кажется всегда недостижимым, вторые — уверены, что найдут реальное решение, которое выполнит задачу на 99%.

Д. Я.В прикладной лингвистике действительно много «подводных камней». Например, появляются новые семантические концепты; то, какими они будут, никогда нельзя предсказать. Скажем, концепт «социальная сеть»: раньше только на каком-то высочайшем уровне абстракции его можно было сопоставить с концептом «средство общения», сегодня же в этом сочетании — вполне конкретный смысл.

Мы уверены, что, обработав таким способом критическое число параллельных текстов на двух языках, мы «устаканим» иерархии. Сейчас над этим работает команда из трёхсот человек; в общей сложности в такой масштабный проект компания ABBYY вложила уже более $70 млн.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Коллектив Авторов читать все книги автора по порядку

Коллектив Авторов - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Цифровой журнал «Компьютерра» № 186 отзывы


Отзывы читателей о книге Цифровой журнал «Компьютерра» № 186, автор: Коллектив Авторов. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x