Андреас Вайгенд - BIG DATA. Вся технология в одной книге

Тут можно читать онлайн Андреас Вайгенд - BIG DATA. Вся технология в одной книге - бесплатно ознакомительный отрывок. Жанр: comp-db, издательство Литагент 5 редакция, год 2018. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    BIG DATA. Вся технология в одной книге
  • Автор:
  • Жанр:
  • Издательство:
    Литагент 5 редакция
  • Год:
    2018
  • ISBN:
    978-5-04-094117-9
  • Рейтинг:
    4/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 80
    • 1
    • 2
    • 3
    • 4
    • 5

Андреас Вайгенд - BIG DATA. Вся технология в одной книге краткое содержание

BIG DATA. Вся технология в одной книге - описание и краткое содержание, автор Андреас Вайгенд, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Информация как таковая становится самой значительной отраслью экономики, и базы данных знают о каждом конкретном человеке больше, чем известно ему самому. Чем больше информации о каждом из нас попадает в базы данных, тем в меньшей степени мы существуем.

BIG DATA. Вся технология в одной книге - читать онлайн бесплатно ознакомительный отрывок

BIG DATA. Вся технология в одной книге - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Андреас Вайгенд
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

По мере того как обработка и анализ данных все больше проникают в самые различные сферы жизни человека, вопрос повышения степени информированности общества о проблемах защиты личных сведений приобретает первостепенное значение. Более того, в связи с тем что социальные данные все чаще используются для установления личности человека и передачи информации о его репутации и душевном состоянии, угроза их сохранности приобретает откровенно персональный характер.

Право на ознакомление с коэффициентом использования частной информации

Утечка информации при взломе – катастрофическое неожиданное событие, но есть и нормальные, ожидаемые издержки пользования услугами инфопереработчиков, в число которых входит постепенная эрозия вашей приватности. Мы убедились в том, что для получения релевантных продуктов и сервисов нужно предоставлять инфопереработчику личную информацию. Она представляет собой один из ресурсов для получения отдачи от обработки данных.

Потребление частной информации, как и любого другого ресурса, может быть в большей или в меньшей степени производительным, а процесс ее использования может управляться и бюджетироваться. Синтия Дворк из Microsoft Research считает крайне необходимым наличие количественной оценки потерь частной информации в процессе работы с данными. Настройку информационных систем, позволяющую пользователю избегать прямых негативных последствий передачи им своих личных данных, Синтия называет «дифференциальной приватностью». Она формулирует эту задачу в виде двух вопросов: «Какая технология обеспечивает большую достоверность результата в заданных границах утраты частной информации? Какая технология лучше обеспечивает сохранность частных данных при заданной достоверности результата?» [383]

Компания, работающая в сфере обработки и анализа данных, должна руководствоваться в своей деятельности необходимостью соблюдения оптимального баланса между потерями клиентов в приватности и полезными результатами, которые они получают в обмен на свои данные [384]. Инфопереработку удобнее представлять себе как экосистему, которую разумнее поддерживать исходя из благополучия системы в целом, а не отдельных ее элементов. Баланс между достоверностью и сохранностью частной информации существует для всех, а не для отдельно взятого лица. Выбирая между инфопереработчиками, надо понимать, насколько быстро, медленно, эффективно или неэффективно каждый из них потребляет частную информацию.

Скорость и эффективность потребления частной информации можно сравнить с понятием «скорость сгорания», применяемым в технике и экологии [385]. Инженер может соорудить дровяную печку, расходующую много топлива и производящую не слишком много тепла для обогрева помещения. Печка работает, но она не очень эффективна: на достижение нужного результата, то есть тепла в комнате, уходит слишком много топлива. Поддерживать тепло можно, постоянно подбрасывая дрова, но теплоотдача все равно будет далеко не оптимальной. Возможно, данные в целом уже не являются дефицитным ресурсом, но частная информация им остается, и ее дефицит нарастает. Но, подобно дровам, ценность частной информации может выгорать быстро, не принося при этом особой пользы.

Подтвержденный коэффициент полезного действия современной дровяной печи находится в диапазоне от 60 до 80 процентов при теоретическом максимальном значении этого показателя в 100 процентов. Коэффициент использования частной информации можно рассчитать примерно так же. Его 100-процентное значение будет подразумевать минимальную утрату частного характера информации ради получения конкретного результата, притом что для этого были использованы только абсолютно необходимые данные – например, навигатору требуются лишь данные о текущем местоположении и месте назначения человека, чтобы проложить для него маршрут.

Инфопереработчик находится в постоянном процессе отбора пользовательских данных, которые помогут ему в совершенствовании продуктов и сервисов. В базах данных, которые используются в Amazon для подготовки рекомендаций клиентам, просмотры и покупки не привязаны к конкретным клиентам. В этом нет необходимости, поскольку важны сами по себе траектории перемещения от товара к товару, а не то, что некая Вероника из Омахи кликнула сначала что-то одно, а потом другое. Поэтому некто, изучающий эти базы, не обнаружит в них информации о конкретных людях, и шансы на то, что эти данные каким-то образом нанесут ущерб, невелики.

Работая с сайтом знакомств Fridae, мы проанализировали тысячи заметок, сделанных одними пользователями по поводу других, в диапазоне от «послал мне пять сообщений – надо ответить» или «встретился – не моё» до «диплом с отличием по химии» или «выглядит старше своих 29 лет». Эти заметки мог видеть только автор, другим пользователям они были недоступны. Анализ показал, что таким образом пользователи отмечали тех, с кем они переписывались или встречались безрезультатно, чтобы не тратить время и силы на дальнейшие контакты с ними. Но прежде чем приступить к анализу содержания заметок, мы удалили все имена пользователей. Это позволило уменьшить объем частной информации, которую нам нужно было израсходовать в процессе совершенствования сервиса Fridae. Чтобы выявить закономерности содержания заметок и подумать о новых функциях или разделах сайта, знания о предпочтениях конкретных людей не требовалось.

Если вопрос об эффективности не стоит, то создать очень мощную машину проще. Двигатель для гоночной машины «Формулы-1» пожирает бензин в огромных количествах. Вообще говоря, на протяжении десятилетий автопроизводители не слишком беспокоились по поводу расхода топлива, поскольку оно было дешевым и, как тогда казалось, имелось в неограниченных количествах. А покупателей больше интересовали другие вещи, вроде внешнего вида, мощности, надежности и цены. Нефтяной кризис 1970-х годов способствовал переосмыслению плюсов и минусов различных аспектов конструкции двигателей. Государства потребовали повысить коэффициент полезного действия топлива, а на автозаправках потребители стали считать каждую копейку.

Эффективность использования топлива, измеряемая в США как количество миль на галлон бензина, может сильно варьироваться в зависимости от потребности двигателя. Городской цикл с его многочисленными остановками и низкой скоростью обычно бывает менее экономным с точки зрения расхода топлива, чем езда по скоростному шоссе. Имеют значение также и погода, и другие нагрузки на двигатель, например включенный кондиционер. Американское Агентство по охране окружающей среды, испытывая автомобили по пяти лабораторным сценариям вождения, сводит результаты различных видов движения в единый коэффициент полезного действия топлива. Агентство считает, что «Испытание автомобилей в лабораторных условиях создает равные условия для всех машин и обеспечивает сопоставимость, точность, устойчивость и объективность результатов» [386].

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Андреас Вайгенд читать все книги автора по порядку

Андреас Вайгенд - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




BIG DATA. Вся технология в одной книге отзывы


Отзывы читателей о книге BIG DATA. Вся технология в одной книге, автор: Андреас Вайгенд. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x