Алексей Кутовенко - Профессиональный поиск в Интернете

Тут можно читать онлайн Алексей Кутовенко - Профессиональный поиск в Интернете - бесплатно ознакомительный отрывок. Жанр: Интернет, издательство Издательство «Питер»046ebc0b-b024-102a-94d5-07de47c81719, год 2011. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Профессиональный поиск в Интернете
  • Автор:
  • Жанр:
  • Издательство:
    Издательство «Питер»046ebc0b-b024-102a-94d5-07de47c81719
  • Год:
    2011
  • Город:
    СПб
  • ISBN:
    978-5-459-00334-5
  • Рейтинг:
    4.2/5. Голосов: 101
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 80
    • 1
    • 2
    • 3
    • 4
    • 5

Алексей Кутовенко - Профессиональный поиск в Интернете краткое содержание

Профессиональный поиск в Интернете - описание и краткое содержание, автор Алексей Кутовенко, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru

Найти нужную и актуальную информацию в Интернете порой очень непросто. Количество информационного мусора в Сети растет как снежный ком, и добраться до данных, которые вам действительно необходимы, используя традиционные Яндекс и Google, иногда просто невозможно. Книга, которую вы держите в руках, позволит увеличить эффективность вашего поиска информации в Интернете во много раз. Здесь описаны приемы, поисковые сайты и программы для специализированного поиска информации. Рассмотрены современные разновидности интернет-поиска: универсальный поиск, вертикальный поиск, метапоисковые системы, построение персональных поисковиков, поиск аудиовизуального контента, поиск по скрытому Интернету. Для всех рассмотренных систем приведены их характеристика и советы по максимально эффективному использованию.

Профессиональный поиск в Интернете - читать онлайн бесплатно ознакомительный отрывок

Профессиональный поиск в Интернете - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Алексей Кутовенко
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Нельзя не отметить наличие сервиса поиска изображений, оптимизированного для смартфонов и телефонов. Этот сервис доступен в общем пакете сервисов Яндекса для мобильных устройств.

Рассказ о вертикальных базах универсальных поисковиков мы завершим анонсированным во вступлении к этой главе тестом качества их поиска. Сначала попробуем оценить охват поисковых сервисов Google Картинки и Яндекс.Картинки. Для этого достаточно будет посмотреть на общее количество результатов каждого поисковика по одинаковым запросам. В качестве тестового задания выступит фраза «космонавт Юрий Гагарин». Этот запрос, на момент написания данных строк, принес на Google 2510 результатов, на Яндексе – 780. Налицо более чем трехкратное преимущество Google.

Поскольку поиск картинок идет по косвенным признакам, посмотрим, насколько высок уровень информационного шума. На. Яндексе первое изображение, не относящееся напрямую к первому космонавту. Земли и названному в его честь кораблю (это был портрет космонавта № 4, Павла. Поповича), появилось на шестой странице выдачи В Google это событие произошло гораздо раньше, уже на шестнадцатой позиции списка выдачи появилось фото неизвестного спортсмена-воднолыжника. Значительный информационный шум, при котором количество релевантных результатов практически сравнялось с мусором, у Google возник уже на седьмой странице. Яндекс продержался до девятой страницы.

После включения режима распознавания лиц выяснилось, что на обоих поисковиках он работает отменно, сбоев не было. Яндекс нашел 102 портрета, Google – 282. Что же касается точности, то оба поисковика опростоволосились уже на первых страницах выдачи Яндекс показал Павла Поповича на 18-й позиции, а Google – неизвестную даму на 11-й. Информационно-мусорный «полураспад» наступил в Яндексе на четвертой странице (6 из 20 изображений не относились к теме). Заметим, что численное превосходство релевантных результатов на сервисе Яндекс.Картинки сохранилось до последней страницы выдачи Google в аналогичных условиях сдался уже на четвертой странице. Перелом был достаточно резкий: начиная с шестой-седьмой страницы в результатах можно было найти практически кого угодно, но только не космонавта Гагарина.

В случае использования цветовых фильтров при отборе портретов количество результатов предсказуемо и резко сокращается. Максимум результатов на Яндексе дала белая гамма. Правда, там было немало ложных срабатываний на картинки с белым фоном и обводками. Что касается остальных цветов, то Яндекс оказался достаточно требовательным: искомый цвет для прохождения фильтра должен быть преобладающим в изображении. Как и прежде, Google превосходил Яндекс в количестве результатов каждого цвета – у Google список выдачи после применения фильтра измерялся сотнями картинок. Однако нельзя не заметить, что Google демонстрирует другой, гораздо более либеральный подход к фильтрации: для прохождения фильтра на изображении достаточно простого присутствия объекта искомого цвета.

Flickr

В качестве примера системы поиска изображений рассмотрим принадлежащий Yahoo! проект фотохостинга Flickr – один из крупнейших в мире ресурсов такого плана. Количество изображений в его базе исчисляется многими миллионами. Данный проект предлагает практически все типичные для данного класса ресурсов инструменты поиска.

Поиск ведется только в собственной базе Flickr, изображения в которую загружаются пользователями ресурса. Необходимо помнить, что снимки на ресурсе могут быть как публичными, так и приватными. В последнем случае они доступны только владельцам и приглашенным пользователям.

На Flickr доступны простой и расширенный режимы поиска Простой режим поиска - фото 73

На Flickr доступны простой и расширенный режимы поиска. Простой режим поиска, кроме поля ввода запроса, предлагает несколько фильтров. Область поиска определяется переключателями, расположенными над полем ввода запроса. При выборе одного из трех доступных вариантов (Photos, Groups, People) меняется содержимое расположенного рядом меню Search. Переключатель Photos позволяет вести поиск среди всех публичных изображений базы Flickr, в архивах персональных профилей, в загрузках пользователей из адресной книги вашего аккаунта или же в базе Getty Images, в которую попадают наиболее удачные снимки. При желании можно воспользоваться опциями, ограничивающими поиск введенного текста только описаниями фото или же присвоенными им тегами. Переключатель Groups позволяет найти тематические группы пользователей Flickr. Необходимо отметить, что последующий поиск в архивах таких тематических групп достаточно эффективен и позволяет добиться хороших результатов. Переключатель People предлагает поиск имен пользователей (рис. 7.3).

Рис 73 Интерфейс простого поиска фотохостинга Flickr Режим расширенного - фото 74

Рис. 7.3. Интерфейс простого поиска фотохостинга Flickr

Режим расширенного поиска предлагает поиск с использованием логических операторов и поиск по точной фразе. Присутствуют и дополнительные фильтры, позволяющие указывать тип нужного контента (фото, видео, рисунки), вести поиск по дате создания или загрузки изображения, включать «семейный фильтр», а также отбирать фотоработы, предоставленные по лицензии Creative Commons.

Страница результатов поиска предлагает просмотреть расположенные мозаикой миниатюры изображений. Предлагаются три режима отображения миниатюр, отличающиеся размером каждой миниатюры и подробностью текстового описания. Боковая панель страницы выдачи содержит список групп, изображения из архивов которых попали в результаты поиска, список фотографов, а также перечень географических местоположений, где были сделаны найденные снимки. Расширить или уточнить свой запрос можно с помощью инструмента Tag Clusters, в котором демонстрируется перечень тегов, отмечающих изображения текущей страницы выдачи.

CBIR-системы

Аббревиатура CBIR обозначает технологии поиска картинок, основанные на анализе характеристик изображенных на них объектов. Другими словами, CBIR-система пытается «рассмотреть» содержимое самой картинки.

Контентный анализ изображения нельзя назвать «горячей новинкой» – подобные технологии давно и активно используются в системах видеонаблюдения, более того, они давно работают за кулисами универсальных поисковиков в качестве части так называемых «семейных» фильтров. Экспериментальные машины просто дают пользователям контроль над таким режимом поиска и предлагают новые, оригинальные интерфейсы.

В общем виде CBIR-система, как и обычный поисковик, работает в два этапа: индексирование и собственно поиск по запросу пользователя. На первом этапе каждое изображение описывается и заносится в базу данных. Как мы уже выяснили, обычные интернет-поисковики ориентируются на тексты содержащих изображения веб-страниц, имена графических файлов и другие косвенные признаки. В отличие от них CBIR-система с помощью специальных алгоритмов анализирует характеристики самого изображения – его цветовую гамму, композицию, очертания предметов и другие подобные признаки. Есть принципиальные отличия и на этапе поиска картинок. Поскольку индексируемые признаки у CBIR-поисковиков не совсем обычные, то и предлагаемые пользователям инструменты составления запросов заметно отличаются от привычных форм с полями ввода ключевых слов.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Алексей Кутовенко читать все книги автора по порядку

Алексей Кутовенко - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Профессиональный поиск в Интернете отзывы


Отзывы читателей о книге Профессиональный поиск в Интернете, автор: Алексей Кутовенко. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x