Компьютерра - Компьютерра PDA N166 (31.03.2012-06.04.2012)
- Название:Компьютерра PDA N166 (31.03.2012-06.04.2012)
- Автор:
- Жанр:
- Издательство:неизвестно
- Год:неизвестен
- ISBN:нет данных
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Компьютерра - Компьютерра PDA N166 (31.03.2012-06.04.2012) краткое содержание
ОГЛАВЛЕНИЕ
Василий Щепетнев: Василий Щепетнёв: Колыбель живоглота
Ника Парамонова: Обзор флэш-карты Apacer AH351
Сергей Голубицкий: Голубятня: Гешефт прислонившихся
Михаил Ваннах: Кафедра Ваннаха: Сеанс чёрной магии
Евгений Лебеденко, Mobi.ru: Telautograph: месть Cерого кардинала
Дмитрий Шабанов: Чудеса самообмана
Сергей Голубицкий: Голубятня: Ударим графематикой по графомании!
Олег Нечай: Обзор электронной книги PocketBook Touch
Дмитрий Вибе: Всюду жизнь
Компьютерра PDA N166 (31.03.2012-06.04.2012) - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
Кстати, именно поэтому я уважительно отношусь к циникам. Давайте не будем сравнивать человека, который нарушает служебные обязанности и способен сказать: "Знаешь, я наплевал на правила игры и реализую свой частный интерес", с тем, кто выполняет свои обязанности добросовестно. Зато первого из них стоит сравнить с тем, кто совершает абсолютно эгоистичные действия, рассказывая, что печётся исключительно об общественном благе. Я осознанно предпочту иметь дело с тем, кто осознаёт собственные действия, а не со специалистом по самообману. С первым можно договориться рационально, со вторым – нет.
И сам я стараюсь быть рациональным. Как хорошо, что такое вытеснение неблагоприятных для самооценки событий мне не свойственно! Я-то, благодаря своему интеллекту и развитой способности к рефлексии, воспринимаю себя вполне адекватно. По крайней мере, мне никогда не говорили о неадекватности моих воспоминаний. А если и говорили, то я об этом забыл.
Не так давно ко мне подошла девушка, которую я видел впервые в жизни. Улыбаясь, она сказала: "Здравствуйте, Дмитрий Андреевич! Я так рада Вас видеть! Я давно хотела Вам сказать, как я Вам благодарна, и как раз за объяснение тех вещей, которые вызвали тогда конфликт между нами!" Я сказал ей, что она обозналась; она настаивала, что мы знакомы, и назвала свое имя и фамилию (ни о чём мне не говорившие; я очевидно слышал их впервые).
— "Вы же работали тогда-то в такой-то школе?" — "Да, работал". — "Вы тогда объясняли нам разницу мужских и женских стратегий, я по молодости Вас не поняла, и моя мама ходила к директору..."
Я объяснил девушке, что ничего не помню, и прервал разговор. Вскоре я увидел коллегу, который тоже работал в упомянутой школе, и пересказал ему этот разговор. Тот искренне удивился: "Как ты можешь её не помнить, если тебя выперли из-за неё?" Он рассказал то, чему я был вынужден поверить. В специальном (!) курсе, посвящённом эволюции, я, кроме прочего, объяснил выпускникам (!) биологического (!) класса примерно то, что излагал в этих трёх колонках. Одна девушка поняла меня неверно (можно ли её за это осуждать?). Она пересказала то, что поняла, своей матери. Та истолковала мои пояснения ещё превратнее и захотела обсудить их с директором. В результате я перестал работать в этом заведении.
Кое-что о своей работе в этой школе я помню. Например, я начал там работать вместе с толковым школьником, который поступил к нам университет, с успехом защитил диплом по зелёным лягушкам под моим руководством и сейчас прекрасно чувствует себя в Швеции. А вот эту девушку и всю связанную с ней историю я забыл. Интересно, почему?
Если бы наша рефлексия была безукоризненной, наверное, такие ситуации не возникали бы... Но что мы знаем о нашей способности к рефлексии? Как она возникла?
Об этом как-нибудь в иной раз...
Голубятня: Ударим графематикой по графомании!
Автор: Сергей Голубицкий
Опубликовано 05 апреля 2012 года
Писатель: Я писатель!
Читатель: А по-моему, ты говно!
(Писатель стоит несколько минут, потрясённый этой новой идеей, и падает замертво. Его выносят.)
Даниил Хармс
Культур-повидлианствовать сегодня будем в пандан софтверному аппендиксу. В смысле, что не традиционный не пришей-к-красной-армии-рукав, а одно вытекает из другого, да и связано напрямую.
Разговор пойдет о разработке наших ученых-соотечественников, бороздящих ниву на стыке самых перспективных отраслей знания: структурно-прикладной лингвистики и компьютерных технологий.
Если с компьютерами вопросов, обычно, не возникает, то роль лингвиста почему-то в общественном сознании откровенно не дотягивает до заслуженного места. В лучшем случае, обывателю приходит в голову: переводчик какой-то! Если на пике славы, то - Гоблин. Больше ничего. Неужели придется дожидаться эпохи «Stargate» (помните еще культовый фильм Роланда Эммериха?), чтобы понять, что лингвист - это главный пророк нашей цивилизации (астролог, Дельфийский оракул и компьютерный томограф в одном флаконе!)?
Эк меня понесло! Короче говоря, один из разработчиков, Дмитрий Силницкий, зная о моих слабостях в сфере интерпретации смыслов и дата-майнинга, прислал на тестирование демо-версию совершенно уникального движка, который выполняет сравнительный анализ текстов по авторскому стилю и жанру.
При этом движок понятия не имеет о существовании автора имярек, да и вообще не догадывается о смысле слов и денотатах в принципе. Основа движка - графематический анализ, оперирующий лишь цепочками языковых символов - знаками, буквами и словоформами!
Для хотя бы приблизительного объяснения этого монстра позволю небольшую цитату из теоретического сопровождения разработок (текст Игоря Ножова из РГГУ):
«Основная цель графематического блока получить выборку полных словоформ из массива текстов базы данных. Графематический анализ работает с внешним представлением текста и использует таблицу стоп-слов. В этой таблице хранятся цифры, спецсимволы и частотные слова языка, нерелевантные для поиска по текстам.
Графематический анализ выполняет три функции:
1. отсечение стоп-слов в тексте;
2. разбиение данных на три потока;
3. индексация каждого потока.
Единицей графематического анализа является цепочка символов, выделенная с двух сторон пробелами. Выделенная цепочка символов подвергается последовательной обработке эвристическими правилами: отсечь знаки пунктуации, проверить присутствие гласных внутри цепочки, чередование верхнего и нижнего регистров и т.д. В зависимости от результатов обработки полученная цепочка символов направляется в один из трех потоков данных:
- цифровые и символьные комплексы (‘кг’, ‘ст.’, ’12.01.99’);
- аббревиатуры - названия государств, организаций, предприятий (‘СССР’, ‘ЮНЕСКО’, ‘ДорСтройСервис’);
- полные словоформы»
В результате столь необычного и внешне совершенно схоластического анализа мы получаем более, чем осмысленные результаты. Именно созерцание практических результатов произвело на меня неизгладимое впечатление.
Я получил демо-версии аналитического движка для двух баз данных. Первая - англоязычная - проводила стилистический и жанровый анализ относительно хоть и скромной, но вполне репрезентативного массива данных, насчитывающего 2995 авторов и 6266 произведений. Вторая - русскоязычная - чисто номинальная - лишь 700 книг авторов, выражающих мысли на великом и могучем.
Естественно я начал тестирование с себя любимого: ввел в анализатор текст книги «Как зовут вашего бога». На выходе получил такой результат:
Как видите графематический анализатор опознал мой стиль почти с абсолютной точностью - коэффициент корреляции 95,84 %! Далее идет Вильгельм Адам (кто это?) и много всяких незнакомых товарищей - вплоть до Ильфа и Петрова (62,70 %) и Михаила Веллера (42,66%).
Читать дальшеИнтервал:
Закладка: