Компьютерра - Журнал «Компьютерра» № 38 от 17 октября 2006 года

Тут можно читать онлайн Компьютерра - Журнал «Компьютерра» № 38 от 17 октября 2006 года - бесплатно полную версию книги (целиком) без сокращений. Жанр: Прочая околокомпьтерная литература. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.

Компьютерра - Журнал «Компьютерра» № 38 от 17 октября 2006 года краткое содержание

Журнал «Компьютерра» № 38 от 17 октября 2006 года - описание и краткое содержание, автор Компьютерра, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru

Журнал «Компьютерра» № 38 от 17 октября 2006 года - читать онлайн бесплатно полную версию (весь текст целиком)

Журнал «Компьютерра» № 38 от 17 октября 2006 года - читать книгу онлайн бесплатно, автор Компьютерра
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Есть, однако, и отрицательный момент: 96 скачанных гигабайт цифрового приданого лежат мертвым грузом на природной ограниченности 24-часовых суток: из сорока пяти новых фильмов за месяц я нашел время на посмотреть только четыре, из сотни новых книжек бегло пролистал дай-то бог десяток, из семидесяти новых пластинок прослушал в машине семь… О софте вообще не говорю — давно слит на бэкапные диски и забыт.

Это-то все и беспокоит. Причем не в частностях, а по существу: за каким лешим нам нужно новое? Что с ним делать? Я давно уже понял, что информационное накопительство является идентичной сублимацией накопительства материального — все тот же трагический тупик консьюмеризма, в который мы сами себя загнали после утраты последних проблесков духовных ориентиров. Интерполируя Федора Михайловича в XXI век: если бога нет, вовсе не обязательно мочить процентщиц, можно довольствоваться коллекционированием крутых тачек либо загружать свежие программы по торренту. Follow me?

Вот и спрашивается: нужно ли потчевать читателей «Голубятен», которые к тому же давным-давно осознали, что изюмина колонки не в софте, а повидле, новыми программами? Может, лучше заняться информационной интенсификацией? В смысле, что рассказывать о реальной работе с реальным, давно зарекомендовавшим себя софтом? Тем самым, от которого есть прок, есть творческая польза, отличная от пользы истерического хватательного рефлекса, возникающего на почве сублимации страха смерти?[Думаю, все понимают, что мы покупаем всё новые и новые игрушки — от яхт до цифровых фотоаппаратов и женщин — да и просто стремимся к потреблению удовольствий жизни, дабы забить в беспробудное подсознание зияющий ужас мысли:

«Настанет миг, когда меня, вот именно меня, такого пушистого и любимого, не станет»] Однозначного ответа для себя самого я так и не нашел, поэтому самым разумным представляется диверсификация. Скажем, одна «Голубятня» об интенсивном сельском хозяйстве, следующая — об экстенсивном, третья — вообще из одного повидла. Ну вы меня понимаете.

В контексте только что выработанной и утвержденной новой линии партии расскажу об одном предельно важном аспекте дата-майнинга, коим в той или иной мере занимаются все люди, работающие с компьютером. Читатели «Голубятен» прекрасно знакомы с моим алгоритмом МИНОА [Методы Изыскания, Накопления, Обработки и Анализа информации], поэтому не буду повторяться. Сегодня поговорим о выборочном слежении за изменяющимся содержанием веб-страниц с помощью хорошо знакомой читателям программы первого этапа дата-майнинга (изыскания информации) — WebSite-Watcher.

Поясню на простом примере, о чем идет речь. Предположим, мы отслеживаем регулярные изменения на сайте типа библиотеки «Альдебаран» (рис. 1).

На скриншоте видно что помимо содержательной информации списка новых - фото 23

На скриншоте видно, что помимо содержательной информации (списка новых ежедневных поступлений) программа отлавливает и паразитарные изменения: в правом верхнем углу приводится изменяющееся количество книг и авторов библиотеки. Вопрос: нужно ли отфильтровывать паразитарную информацию в данном случае? Ответ: разумеется, не нужно. По вполне понятной причине: сайт библиотеки «Альдебаран» ежедневно пополняется новыми книгами, за которыми вы так или иначе будете следить.

Соответственно дополнительный желтый хайлайтинг паразитарной информации не - фото 24

Соответственно, дополнительный желтый хайлайтинг паразитарной информации не снижает эффективность вашей работы (вы просто проигнорируете цифры новых книг и авторов). Соответственно, когда вы вбиваете в WebSite-Watcher линк на «Альдебаран», вы не вносите никаких изменений в раздел фильтров (рис. 2).

Взгляните теперь на такую страницу рис 3 Мы отслеживаем ветку одного из - фото 25

Взгляните теперь на такую страницу (рис. 3). Мы отслеживаем ветку одного из бакунианских форумов, на котором обновления случаются спорадически и непредсказуемо. Тем не менее при каждой проверке WebSite-Watcher старательно отлавливает паразитарные изменения, о которых и уведомляет пользователя. В нашем примере: в правом верхнем углу окна меняется новостной фидер с совершенно ненужной нам информацией. Вопрос: нужно ли устанавливать фильтр слежения? Ответ чисто апофатический: попробуйте его не установить, если в вашем списке WebSite-Watcher числится более сотни объектов (у меня их вообще 215)! Дело в том, что подавляющее большинство сайтов принадлежит как раз ко второму типу, в котором объем паразитарной информации зашкаливает по сравнению с изменениями по существу. В результате на слежение за псевдоизменениями уходит от 15 до 30 минут ежедневно. Полчаса жизни, потраченных впустую! Для меня лично это непростительная роскошь.

Итак, надлежит просеять паразитарную информацию. Я бы не завел разговор о фильтрах, если бы предварительно не опросил своих студентов, посаженных на иглу дата-майнинга: все они знают, что программа умеет производить тонкую настройку слежения, и при этом ни один человек ею не пользуется! Почему? Учебная курса себе дороже! Оно понятно: опция фильтрования в WebSite-Watcher доведена до такого профессионального совершенства (чего стоит целый язык псевдопрограммирования, позволяющий разложить на атомы html-код любой веб-страницы!), что руки опускаются, еще не поднявшись. А напрасно! Сейчас я вам продемонстрирую, как простые нужды фильтрации (а это 90% всех случаев) удовлетворяются за считанные секунды.

Формулируем задачу в нашем примере: необходимо исключить из слежения кусок веб-страницы, который начинается словами «Новости» (самый верх страницы справа) и заканчивается заголовком ветки форума, которая нас, собственно, только и интересует.

Вот как это делается.

1. В свойствах страницы слежения (Alt+Enter или через меню Закладки — Свойства) — закладка «Общие» — на ней кнопка «Мастер фильтра»: выделяем мышью слово «Новости» (рис. 4).

2 Нажимаем на кнопку Создать фильтр вручную Новый фильтр Игнорируемые - фото 26

2. Нажимаем на кнопку «Создать фильтр вручную» — «Новый фильтр Игнорируемые» — "Текст между двумя выделениями (Начало/Конец) — «Выделенный текст содержит изменяющиеся числа» (рис. 5).

3 Теперь задаем окончание игнорируемого фрагмента сначала выделяем мышью - фото 27

3. Теперь задаем окончание игнорируемого фрагмента: сначала выделяем мышью заголовок ветки («Компьютерный форум» и т. д.), затем кликаем на кнопку «Маркер окончания текста — создан!» — в подменю «Выделенный текст содержит изменяющиеся числа» (не перепутайте последовательность действий) (рис. 6).

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Компьютерра читать все книги автора по порядку

Компьютерра - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Журнал «Компьютерра» № 38 от 17 октября 2006 года отзывы


Отзывы читателей о книге Журнал «Компьютерра» № 38 от 17 октября 2006 года, автор: Компьютерра. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x