Алексей Кутовенко - Профессиональный поиск в Интернете
- Название:Профессиональный поиск в Интернете
- Автор:
- Жанр:
- Издательство:Издательство «Питер»046ebc0b-b024-102a-94d5-07de47c81719
- Год:2011
- Город:СПб
- ISBN:978-5-459-00334-5
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Алексей Кутовенко - Профессиональный поиск в Интернете краткое содержание
Найти нужную и актуальную информацию в Интернете порой очень непросто. Количество информационного мусора в Сети растет как снежный ком, и добраться до данных, которые вам действительно необходимы, используя традиционные Яндекс и Google, иногда просто невозможно. Книга, которую вы держите в руках, позволит увеличить эффективность вашего поиска информации в Интернете во много раз. Здесь описаны приемы, поисковые сайты и программы для специализированного поиска информации. Рассмотрены современные разновидности интернет-поиска: универсальный поиск, вертикальный поиск, метапоисковые системы, построение персональных поисковиков, поиск аудиовизуального контента, поиск по скрытому Интернету. Для всех рассмотренных систем приведены их характеристика и советы по максимально эффективному использованию.
Профессиональный поиск в Интернете - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Современные FTP-поисковики обладают весьма схожими интерфейсами составления запросов. Это означает, что освоив работу с одним таким ресурсом, пользователь впоследствии сможет разобраться в большинстве других систем, даже если их интерфейсы выполнены на незнакомом языке. К таким типовым элементам относятся. Тип поиска (Search Type), Сортировка (Sort by) и количество показываемых результатов на одной странице. Обычной также является опция показа либо скрытия файлов для *nix-систем. Это средство позволяет убрать из результатов поиска архивы дистрибутивов, в которых могут быть многие тысячи файлов, не очень-то полезных, если вы ищете что-нибудь для Windows.
FileSearch.ru
Одним из крупнейших FTP-поисковиков в русском сегменте интернета является проект FileSearch.ru. Он индексирует большинство российских FTP-серверов и несколько тысяч зарубежных проектов. В базу включаются только серверы с анонимным доступом и DNS-именем. Индексная база FileSearch.ru насчитывает около восьми миллионов файлов. Обновление индекса для каждого FTP-сервера, как правило, производится каждые пять дней. Если какой-либо включенный в базу FTP-сервер перестает откликаться на запросы робота-индексатора, то через три недели молчания он исключается из базы данных, что сокращает количество «мертвых» ссылок в результатах поиска.

Данный поисковик обладает всеми необходимыми для успешного поиска инструментами FileSearch предлагает режимы простого и расширенного поиска файлов. При простом поиске предлагаются два фильтра, выполненных в виде выпадающих меню рядом с полем ввода запроса. Первый фильтр позволяет указать тип контента: файл, каталог, музыку, видео, изображения, а также сервер. Последний вариант дает возможность поиска имен FTP-серверов. Второй фильтр предназначен для ограничения поиска определенным доменом, список которых представлен в меню фильтра.
Расширенный поиск, кроме фильтра доменов, предлагает усложненный фильтр типа контента (рис. 9.1). Кроме доступных при простом поиске вариантов, здесь добавлены режимы поиска по регулярным выражениям и по точной фразе. Дополнительными признаками файла в ходе расширенного поиска может выступать его размер, который разрешается указать в виде диапазона, выраженного в байтах. Сферу поиска можно ограничить не только доменом, но и конкретным каталогом FTP-сервера. В режиме расширенного поиска FileSEarch.ru также доступны фильтры, позволяющие исключить из списка выдачи файлы, предназначенные для операционных систем семейства *nix.

Рис. 9.1. Инструменты расширенного поиска Filesearch.ru
Доступны здесь и некоторые опции настройки просмотра результатов поиска. Можно выбрать способ сортировки найденных файлов: по имени, дате добавления или размеру. Кроме того, можно включить режим вывода в результатах поиска размера файла в байтах, а также даты его добавления в индекс.
Отдельно выделен режим поиска драйверов. После выбора конкретного устройства в каталоге оборудования различных производителей начинается стандартный поиск FileSearch по имени файла. К сожалению, объем этого каталога совсем невелик и в нем немало ошибок.
FileSearch.ru поддерживает несколько типов запросов. Первый и самый простой – поиск на включение. При таком запросе ведется поиск ссылок, содержащих указанную последовательность символов, которая может быть частью имени нужного файла или каталога.
Второй тип запросов – поиск по маске. Он во многом напоминает поиск файлов на дисках локального компьютера. Подстановочные спецсимволы? и * в запросе соответственно означают, что вместо них в искомом слове может быть любой символ или несколько любых символов.
Третий тип запросов – поиск с использованием регулярных выражений. Такие запросы позволяют максимально подробно указать свои требования к имени файла или каталога. Среди языка запросов FTP-поисковиков не наблюдается такого разнообразия, как в языках универсальных интернет-поисковиков, что несколько облегчает жизнь пользователя. В приложении А вы найдете описание синтаксиса регулярных выражений FileSearch.ru, которыми можно с успехом пользоваться и при работе с другими поисковиками.
Страница поисковой выдачи FileSEarch.ru достаточно проста и предоставляет только необходимый минимум информации о найденных файлах. Каждому файлу выделена ровно одна строка. Тип найденного ресурса обозначается графическим значком. Демонстрируется размер файла в килобайтах, а также полный адрес файла. Если по запросу ничего не было найдено, система предлагает повторить поиск на внешних поисковых системах.
Веб-мастера могут установить на своем сайте форму поиска FileSearch, код которой можно найти на странице Вопросы/ответы.
Поиск на файловом хостинге Rapidshare
На множестве интернет-ресурсов для хранения файлов используются внешние сервисы. Как результат, файлообменники содержат большое количество полезного контента. Однако встроенные системы поиска в архивах таких ресурсов – скорее редкое исключение из правил. Непосредственный поиск файлов требует применения специализированных инструментов.
На универсальных машинах исторически первым средством извлечения ссылок на файлы из архивов файлообменников были сложные поисковые выражения. В Google с помощью операторов intitle и inurl можно было найти немало таких файлов. Правда, для этого надо было озаботиться изучением операторов и располагать временем на эксперименты. Инструменты автоматизации такого поиска не заставили себя долго ждать.
Некоторые поисковики для Rapidshare продолжают использовать такой подход, реализованный на новом уровне: добавление дополнительных операторов и фильтров происходит автоматически и прозрачно для пользователя. Недостатки подобных поисковиков достаточно очевидны. Во-первых, поиск идет в основном в тексте ссылок. Это значит, что формируя поисковый запрос, приходится в первую очередь угадывать имя нужного файла, в результате страдает полнота поиска. Кроме того, полезные результаты сопровождаются значительным информационным шумом.
Второе дыхание поисковиков для файлообменников открылось с распространением технологий персонального поиска. Действительно: куда перспективней сосредоточиться на поиске по страницам ресурсов, точно содержащих ссылки на «рапидовские» файлы, чем изощряться в составлении сложных запросов, работающих «по площадям». Поскольку такие веб-страницы, как правило, содержат описания выложенных файлов, их можно использовать как дополнительный источник поисковых признаков. Достоинство такого подхода – он действительно работает и не слишком сложен в реализации. От создателя поисковика, по большому счету, требуется только собрать достойный список ресурсов, публикующих файлы на Rapidshare или на других файлообменниках.
Читать дальшеИнтервал:
Закладка: