Андреас Вайгенд - BIG DATA. Вся технология в одной книге

Тут можно читать онлайн Андреас Вайгенд - BIG DATA. Вся технология в одной книге - бесплатно ознакомительный отрывок. Жанр: comp-db, издательство Литагент 5 редакция, год 2018. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    BIG DATA. Вся технология в одной книге
  • Автор:
  • Жанр:
  • Издательство:
    Литагент 5 редакция
  • Год:
    2018
  • ISBN:
    978-5-04-094117-9
  • Рейтинг:
    4/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 80
    • 1
    • 2
    • 3
    • 4
    • 5

Андреас Вайгенд - BIG DATA. Вся технология в одной книге краткое содержание

BIG DATA. Вся технология в одной книге - описание и краткое содержание, автор Андреас Вайгенд, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Информация как таковая становится самой значительной отраслью экономики, и базы данных знают о каждом конкретном человеке больше, чем известно ему самому. Чем больше информации о каждом из нас попадает в базы данных, тем в меньшей степени мы существуем.

BIG DATA. Вся технология в одной книге - читать онлайн бесплатно ознакомительный отрывок

BIG DATA. Вся технология в одной книге - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Андреас Вайгенд
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Решение размыть данные обычно не обходится без последствий, а предсказать, что это будут за последствия, зачастую невозможно. Ридер Amazon Kindle регистрирует момент начала и окончания чтения книги, а также то, сколько времени потребовалось на каждую страницу. Опасаясь за свои оценки, школьник может не хотеть, чтобы эту информацию видел его учитель, даже если она нужна последнему для того, чтобы подтянуть ученика по предметам, вызывающим затруднения. Можно предоставлять Amazon или другому книжному магазину максимально детализированные данные, чтобы получать информацию о том, что вам может понравиться, после чего обнаружить у своей двери агентов ФБР, поскольку они решили, что вы слишком долго изучали статью о том, как бостонские террористы переделывали скороварку в бомбу. Почти так и случилось в реальной жизни [414].

Чтобы понимать, какое влияние может оказывать размытие различных аспектов информации в различных ситуациях, потребуется время. Получить представление об этом могла бы очень помочь большая прозрачность инфопереработчиков относительно зависимости ценности продуктов и услуг от степени детализации информации. Кроме того, было бы крайне полезно предоставить пользователям право самостоятельно выбирать настройки детализации данных, отменяя предоставленные по умолчанию. Представьте, что у вас появилась возможность заменить настройки по умолчанию вашего телефона или компьютера настройками конфиденциальности, разработанными или рекомендованными Фондом электронных рубежей, Союзом гражданских свобод или аналогичными организациями. Вам могли бы предоставить несколько типов настроек для разных типов пользователя с подробным объяснением преимуществ и недостатков каждого. Попробовав разные настройки, можно было бы определить, какая из них вам больше подходит и, возможно, установить дополнительные.

А можно ли создать среду, позволяющую большую свободу самовыражения в щекотливых ситуациях? Например, человек может опасаться высказывать политические комментарии под собственным именем, когда знает, что его мнение идет вразрез с мнением работодателя, или не признаваться в злоупотреблении спиртным или наркотиками в заметках пациента к медицинской карте.

В 1960-х годах с этой проблемой столкнулся канадский экономист Стэнли Л. Уорнер, собиравший статистику для своей научной работы [415]. Он понял, что у человека часто бывают веские причины не предоставлять полную информацию о себе, и никакие разговоры об общественной значимости и его же собственной пользе не убедят его стать полностью откровенным. При постановке провокационных вопросов вроде «Курите ли вы марихуану?» или «Диагностирован ли у вас ВИЧ?» способов выявить процент обмана не будет (кроме внезапного анализа крови респондентов).

Уорнер сознавал, что некоторые будут лгать и что он не знает, какие именно подгруппы населения более склонны делать это. Если к ложным ответам склонны жители определенных районов, его данные окажутся неисправимо искаженными. Он предложил создать защитный слой между респондентом и его ответом, придав данным элемент хаотичности.

Вот как это устроено: перед ответом на вопрос человек подбрасывает монетку. Если выпадает орел, он дает честный утвердительный или отрицательный ответ, если решка – только утвердительный вне зависимости от соответствия действительности. Только сам субъект опроса знает, дал ли он откровенный ответ или сказал то, что велела монетка. Если впоследствии к человеку возникнут вопросы в связи с его утвердительным ответом, то он всегда сможет сказать, что так выпало, и предъявить ему какие-либо претензии будет нельзя. Прелесть метода Уорнера в том, что он обеспечивает получение необходимой информации при соблюдении интересов граждан. На самом деле полученные таким способом данные могут быть достовернее полученных без использования элемента хаотичности.

Размытие может применяться как к первичной информации, так и к обогащенной. Жонглируя своими подробностями, мы можем затемнять свои личные данные, в полной мере пользуясь плодами агрегирования и анализа для целей прогнозов и рекомендаций.

Право экспериментировать с обработкой данных

Инфопереработчики постоянно экспериментируют с дизайном, настройками и алгоритмами. В предыдущих главах мы узнали, что они экспериментируют и со своими пользователями. Если они могут экспериментировать с нами, мы тоже должны иметь право экспериментировать с ними.

Если право на изменения представляет собой аналог права на свободу самовыражения, а право на размытие – права на самоопределение, то право на эксперимент относится к свободе исследования, предоставлению пользователям права рассматривать разные возможности. К одной из ключевых функций инфопереработчика относится определение порядка, в котором продукты и услуги представляются пользователю. Ранжирование результатов основано на ряде параметров: новизне (во главу списка попадают самые свежие предложения), географической близости (наверху помещают то, что находится ближе) или социальной близости (на топовых позициях оказывается то, что в большей степени соответствует статусу данного человека). Мне по душе сравнение этих настроек с ручками и движками микшерского пульта звукорежиссера, которые используются для изменения баланса источников звука при записи музыкального произведения [416].

К сожалению, движки и кнопки приборов инфопереработчика не всегда видны пользователю. Почему эти настройки так часто помещают в «черный ящик», делая незаметными и недоступными для пользователей? Отнюдь не по таким прозаическим причинам, как лень или жадность, и не из-за стойкой приверженности принципу простоты дизайна интерфейса [417]. Отсутствие доступа к регулировкам обусловлено деловыми соображениями, в том числе и такими: это стоит денег, это может раскрыть коммерческие тайны или даже подвести компанию под суд. Компании не занимаются программированием по индивидуальным заказам. Они не будут добавлять регулировки по просьбе пользователей, однако должны хотя бы предоставить им возможность доступа к уже существующим регулировкам. Но есть и соображения эпистемологического характера. Часто бывает трудно подобрать слово, описывающее назначение какой-либо регулировки, которое стопроцентно было бы понятно пользователям и не создавало им дополнительных трудностей. При этом, как указывают в своем фундаментальном труде «Большие данные» Виктор Майер-Шенбергер и Кеннет Кукьер (издательство Манн, Иванов и Фербер, 2013 г. – Ред. ), прогностические и рекомендательные функции могут использоваться и без досконального понимания того, как они устроены [418]. При всей обоснованности таких соображений они служат и поводом для ограничения права выбора пользователей. Я считаю, что лишь в процессе практического освоения регулировок люди приобретают понимание их назначения и функционала и того, какие настройки подходят им больше.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Андреас Вайгенд читать все книги автора по порядку

Андреас Вайгенд - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




BIG DATA. Вся технология в одной книге отзывы


Отзывы читателей о книге BIG DATA. Вся технология в одной книге, автор: Андреас Вайгенд. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x