Андреас Вайгенд - BIG DATA. Вся технология в одной книге

Тут можно читать онлайн Андреас Вайгенд - BIG DATA. Вся технология в одной книге - бесплатно ознакомительный отрывок. Жанр: comp-db, издательство Литагент 5 редакция, год 2018. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    BIG DATA. Вся технология в одной книге
  • Автор:
  • Жанр:
  • Издательство:
    Литагент 5 редакция
  • Год:
    2018
  • ISBN:
    978-5-04-094117-9
  • Рейтинг:
    4/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 80
    • 1
    • 2
    • 3
    • 4
    • 5

Андреас Вайгенд - BIG DATA. Вся технология в одной книге краткое содержание

BIG DATA. Вся технология в одной книге - описание и краткое содержание, автор Андреас Вайгенд, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Информация как таковая становится самой значительной отраслью экономики, и базы данных знают о каждом конкретном человеке больше, чем известно ему самому. Чем больше информации о каждом из нас попадает в базы данных, тем в меньшей степени мы существуем.

BIG DATA. Вся технология в одной книге - читать онлайн бесплатно ознакомительный отрывок

BIG DATA. Вся технология в одной книге - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Андреас Вайгенд
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать
Право на размытие данных о себе

Право на размытие данных о себе дает возможность определить уровень детализации предоставляемой информации. Чем туманнее информация, которой вы делитесь с инфопереработчиком, тем ниже персонализация услуг, которые можно от него получить. Несмотря на это, у вас должно быть право диктовать собственные условия и решать, какой уровень персонализации нужен в каждой конкретной ситуации. Сегодня можно узнавать невероятно точные подробности о людях, например выяснять их местоположение с точностью до метра с помощью GPS или маячков. Но это не означает необходимость делиться столь точными данными с инфопереработчиком, напротив, мы должны иметь возможность самостоятельно определять, насколько четкую картину мы хотим предоставить. Бинарный выбор между максимально четкой картинкой и неполучением информационной услуги имел смысл только при низкой степени детализации имеющихся данных, но в наши дни это уже не так.

Иногда бывает необходима или желательна высокоточная геолокация, иногда никакой надобности в ней нет. Вы, не задумываясь, предоставите точную информацию о своем местоположении, когда требуется срочная доставка. Если вы не дадите свой точный адрес, доставка пиццы на дом не состоится. В то же время во многих случаях можно получить желаемое без особой детализации информации и с меньшими затратами. Таксиста можно попросить высадить вас на ближайшем к дому перекрестке, а не сообщать ему точный адрес – цена вопроса составит пару минут ходьбы. В большинстве городов вы получите от сервиса Google Maps самый удобный маршрут к месту назначения, даже если укажете немного другой номер дома.

Можно изменять или размывать данные с помощью таких маленьких хитростей, а можно воспользоваться технологиями, чтобы не делать этого вручную. Перед отправкой на обработку точные данные будут лишены некоторого количества деталей или цифровых характеристик. Эрик Хорвиц из Microsoft Research предложил систему, позволяющую варьировать степень разрешения геолокационных данных, отправленных телефоном, в диапазоне от «одного метра» до «планета Земля» [411]. Эрик считает, что установки разрешения могут изменяться в зависимости от конкретной ситуации. Максимальная точность может пригодиться при поисках машины на парковке или нужного товара в магазине. А если вы гуляете по торговому центру в рабочее время, то наверняка предпочтете минимальную. Алгоритм может учитывать ваши пожелания и запоминает их исходя из параметров времени и геолокации. Назначая встречу потенциальному клиенту в торговом центре, вы можете выбрать геолокацию более высокого уровня точности. Кроме того, точность не обязательно измеряется в единицах расстояния. Если вы находитесь в малонаселенной местности, то можете размыть настройку на радиус местонахождения ближайшей тысячи мобильных телефонов, так что идентифицировать вас будет непросто. Ситуации могут быть самые разные. Информационная грамотность подразумевает понимание, каким уровнем детализации отправляемой информации можно обойтись для получения искомого результата.

Геолокация не единственная область, где точность информации можно уменьшать или увеличивать. Связи между людьми, их интересы и чувства, выраженные в кликах и свайпах, релевантность предмета или явления в конкретных условиях, степень приватности или публичности определенного места – все это намного сложнее, чем переключатель «вкл. – выкл.». Жизнь не бинарна, равно как и информация.

Размыть можно многие личные характеристики, в том числе возраст, вес и рост, национальность, религию, место работы, отрасль и должность. Например, LinkedIn дает возможность скрывать детальную информацию о себе при просмотре профайлов других пользователей. Но система устроена таким образом, что, минимизировав открытую информацию о себе, вы получаете информацию о людях, заходивших на вашу страничку с точно таким же уровнем детализации – уровень точности предоставленной информации определяет уровень точности получаемой. Если вы – женщина или представитель этнического меньшинства в поиске работы, то, возможно, захотите, чтобы при первом скрининге вашего резюме оно показывало только инициалы, а не полное имя. Экономисты выяснили, что вероятность приглашения на интервью кандидатов с «этническими» или иностранными именами ниже, чем у обладателей «белых» или привычных [412].

Размытие повышает степень контроля над своими данными в коммерческой среде. Когда вы что-то покупаете, продавцу неизбежно становится известно точное SKU (обозначение ассортиментной позиции), дающее полное представление о товаре и его особенностях. А эти данные могут сказать очень многое о вас лично и о ваших потребительских предпочтениях. Вместо этого при покупке товаров деликатного свойства можно было бы требовать, чтобы их показывали на уровне категории – например, «массажёры» или «товары для расслабления и отдыха» или даже на уровне отдела – например, «Красота и уход» или «Здоровье и быт». Размытие точного SKU до уровня категории защитило бы вас от потенциальной неловкости в случае взлома или случайной утечки, если вы забыли выйти из аккаунта [413]. Конечно, размытие информации о покупке повлияет на рекомендации, поскольку пропадет привязка данного SKU к вашей истории покупок, но, возможно, это как раз то, чего вы в данном случае хотели бы.

Чтобы рассматривать право на размытие с прагматической позиции, вам нужно признать, что вы создаете информацию, подчас исключительно конкретную информацию. Когда системы GPS для гражданского применения были не настолько точны, пользы от навигаторов было не слишком много. Чтобы позвонить с мобильного телефона, нужна связь с базовой станцией, координаты которой, разумеется, известны оператору.

В некоторых случаях четкость данных можно изменять в момент создания. Однако размытие данных «у источника» необратимо. Из-за этого в будущем нельзя будет воспользоваться некоторыми продуктами и услугами, в том числе и теми, о необходимости которых в настоящий момент нет представления. Частично скрыв свои личные данные, можно лишиться возможности совершать оплаты онлайн, поскольку не всегда понятно, какие идентификационные признаки могут понадобиться для авторизации.

Вы можете размыть данные, а позже обнаружить, что для принятия необходимых решений нужна точная информация. Предположим, вы периодически остаетесь ночевать у знакомой, которая живет в квартале, в котором процветает наркоторговля. Поэтому вы размываете ее адрес на радиус нескольких миль вокруг, чтобы не ассоциироваться с репутацией этого квартала. Какое-то время спустя вы решите воспользоваться интернет-сервисом, определяющим риск онкозаболевания в зависимости от посещаемых мест. В нескольких зданиях того «нехорошего» района отмечалось превышение норм концентрации свинца и других канцерогенов, но, поскольку этот адрес у вас был размыт, сервис не сможет правильно оценить ваши риски.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Андреас Вайгенд читать все книги автора по порядку

Андреас Вайгенд - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




BIG DATA. Вся технология в одной книге отзывы


Отзывы читателей о книге BIG DATA. Вся технология в одной книге, автор: Андреас Вайгенд. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x