Андреас Вайгенд - BIG DATA. Вся технология в одной книге
- Название:BIG DATA. Вся технология в одной книге
- Автор:
- Жанр:
- Издательство:Литагент 5 редакция
- Год:2018
- ISBN:978-5-04-094117-9
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Андреас Вайгенд - BIG DATA. Вся технология в одной книге краткое содержание
BIG DATA. Вся технология в одной книге - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Если вы просите Facebook показать вам все фото с вашим тэгом, система должна показать вам их вне зависимости от того, ручные это тэги или компьютерные и есть ли у вас разрешение на просмотр изображения от того, кто его запостил. Поскольку компьютерные тэги являются вероятностными, вы увидите также картинки, на которых Facebook идентифицировал вас с низкой степенью уверенности. Если вы хотите увидеть все изображения, на которых могли оказаться, вам потребуется разобраться с огромным количеством картинок. Для облегчения этой задачи надо иметь возможность ранжировать фото по критерию похожести и варьировать уровень вероятности того, что тэг присвоен именно вам. Наличие подобных инструментов обнаружения приобретает особую важность в свете того, что сведенные воедино многочисленные фото, видео и прочие данные позволяют делать выводы о ваших перемещениях во времени и пространстве подобно тому, как в Vigilant Solutions прослеживают маршруты машины в течение дня по многочисленным изображениям ее номерного знака, присылаемым из разных мест. Право на доступ к своим данным означает доступ к любому связанному с человеком контенту вне зависимости от источника информации.
А что по поводу других людей, фигурирующих на фото или видео? Должны ли вы иметь возможность видеть лица каждого из них? Должны ли вы также иметь возможность видеть тэги людей, не являющихся вашими друзьями? Ведь вы же были на этом мероприятии и можете выяснить, кто эти люди, у организаторов, фотографа и остальных (или использовав обратный поиск в изображениях Google). Это действительно возможно, даже если все лица на фото искусственно размыты или затемнены, как на YouTube – канале полицейского управления Сиэтла. Тем не менее существенные затруднения при идентификации незнакомцев имеют свои плюсы: они являются препятствием для противоправного использования информации. Представьте себе крайний случай: человек присутствует на мероприятии и кружит по помещениям, стараясь попасть на максимальное число фотографий. Затем, получив оповещение о том, что его изображения идентифицированы инфопереработчиком, он может использовать любую публичную информацию, запечатленную на этих фото или привязанную к ним, для того чтобы отследить остальных присутствовавших, в том числе и тех, которых он зачем-либо наметил – либо в качестве потенциальных клиентов (что может причинить им неудобство), либо в качестве жертв сталкинга (что будет преступлением) [353]. Предоставить людям право определять, кто может видеть на фото их имя, проставленное компьютером, значит не просто изменить цену получения такой информации, но и указать на область применения. В целом, при полном уважении к личной жизни людей, стоит делать информацию более доступной, а не сужать круг ее пользователей. Каждый человек должен иметь возможность решать, могут ли другие видеть идентифицирующие его тэги и кто именно входит в число этих людей.
Право на доступ к собственным данным, очевидно, осложняется наличием вопросов о том, кто является «владельцем информации» и что, собственно, означает «владеть информацией». Как видно на примере тэгов, интересы создателей и субъектов информации могут противоречить друг другу, и так было всегда. Наши нынешние представления о собственности складывались в физической реальности. Купив яблоко, я становлюсь его владельцем; оно исключительно мое, и я волен делать с ним все, что угодно. Могу порубить его на мелкие кусочки, могу съесть, могу отдать или продать кому-то еще. Но данное яблоко в данный момент времени может принадлежать только одному лицу. И, разумеется, вернуть съеденный кусочек этого яблока обратно невозможно. В отличие от этого, байтом данных может одновременно пользоваться множество людей и съесть его нельзя. Мы нуждаемся в новом представлении о владении информацией. Владельцами данных могут одновременно являться многие. Владение информацией не означает единоличную власть над ее судьбой, как и исключительное право продавать, покупать, дарить или уничтожать байты. Наоборот, владение информацией – это наличие доступа к данным с возможностью их использования.
После рассмотрения проблемы доступа к данным в этих разрезах становится понятным, почему недостаточно получить гору первичной информации. Право на доступ к своим данным требует значительной осмотрительности в том, что может, а что не может быть показано окружающим. Кроме того, потребуется кропотливая работа по созданию алгоритмов, пользовательских интерфейсов и программного обеспечения, которые смогут частично скрывать личность и предоставлять гибкие возможности коммуникации относительно наличия тех или иных элементов информации у тех или иных пользователей. Эти инновации и в цифровой, и в общественной жизни представляют собой важные и нетривиальные задачи. От их решения зависит наша возможность видеть и использовать свои данные.
Как определить, достаточно ли мы получаем от инфопереработчика взамен на свою информацию? Адекватна ли предлагаемая нам «доходность информации» и насколько приемлем при этом риск? Для полной прозрачности недостаточно видеть только информацию о себе, надо иметь возможность получать информацию, позволяющую судить о деятельности тех, кто занимается ее переработкой.
Я убежден в необходимости инспектировать целостность и сохранность экосистемы инфопереработчика, оценивать его «гигиеничность» с точки зрения устойчивости перед попытками несанкционированного доступа, эффективности работы с данными и ожидаемой «доходности предоставленной информации». Говоря о здоровье, мы понимаем, что соблюдение правил гигиены не является стопроцентной гарантией от заболевания. То же можно сказать и о мерах, направленных на повышение прозрачности обработки информации.
Рассмотрим пример с инспекцией санитарно-гигиенического состояния ресторана, которая во многих регионах является обязательной. В соответствии с установленными правилами ресторан работает, когда в нем соблюдаются необходимые требования, или закрывается, если это не так. И хотя инспектор может запросто закрыть едва ли не любой ресторан (увы, идеалов не бывает), он все-таки не делает этого и обычно присваивает заведениям оценку соответствия санитарно-гигиеническим нормам в диапазоне от «плохо» до «идеально» [354].
Наличие такого диапазона оценок (а не просто шкалы «соответствует – не соответствует») позволяет властям балансировать между двумя различными требованиями своих избирателей – по охране здоровья и динамичности экономики. Человек с ослабленной иммунной системой обычно очень опасается любых инфекций и потому выберет ресторан только с высшей оценкой санитарно-гигиенического состояния. Властям приходится учитывать возможность негативных последствий для такого человека, хотя его случай является крайним. В то же время наверняка найдутся люди, готовые мириться с не совсем безупречной санитарией ради, например, исключительной дешевизны или на удивление изобретательного меню.
Читать дальшеИнтервал:
Закладка: