Андреас Вайгенд - BIG DATA. Вся технология в одной книге
- Название:BIG DATA. Вся технология в одной книге
- Автор:
- Жанр:
- Издательство:Литагент 5 редакция
- Год:2018
- ISBN:978-5-04-094117-9
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Андреас Вайгенд - BIG DATA. Вся технология в одной книге краткое содержание
BIG DATA. Вся технология в одной книге - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Кроме того, у вас должна быть возможность разместить корректирующую информацию (в виде опровержения, пояснения или оговорки) таким образом, чтобы она была в первую очередь видна любому, кто будет просматривать данные, и располагалась выше правок других людей. Далее, поскольку информация о вас может одновременно являться и информацией о других, вам должен быть предоставлен способ подчеркнуть, насколько важна для вас поправка, чтобы инфопереработчики могли определить, как ранжировать и показывать ее другим. Если размещение и приоритезация поправок не будут связаны с какими-то издержками, социальные сети очень скоро будут завалены ими. Чтобы этого не произошло, можно ввести суррогатную плату, предоставив каждому пользователю определенное количество баллов на размещение поправок.
Поправкам могут также присваиваться различные веса в зависимости от степени признания их корректности, включая наличие подтвержденного источника информации и обратной связи других пользователей. Из главы 2 мы знаем, что Reddit разрешает пользователям судить о достоинствах постов голосами «за» или «против» контента и идентифицирует тех, кто пытается обмануть систему, засекая голоса, исходящие от одного пользователя или группы по признаку одинаковых IP-адресов. Голоса «за» или «против» являются дополнением к информации. Но интернет-тролль может задеть или испортить репутацию человека или сетевого сообщества с единственной целью разозлить пользователей. Одним из способов поддержания здоровой экосистемы является требование идентификации каждого дополнения настоящим именем или постоянным псевдонимом. Но и тут не все так просто и однозначно. Ведь постоянный идентификатор гарантирует достоверность правки не больше, чем обещание свидетеля в суде «говорить правду и только правду» гарантирует правдивость его показаний. К тому же такая привязка к личности некорректна в отношении разоблачителей нарушений закона и гражданских прав, для которых идентификация личности может представлять угрозу жизни. Недавние примеры – WikiLeaks, публикующий правительственные документы, Панамский архив с информацией об уклонении от налогов [404]и LaborLink, описывающий условия труда на производстве [405].
Для оценки корректности исправлений можно использовать их метаданные, например время и место их создания. Видео– и аудиозаписи содержат фоновые шумы, по которым определяется частота электрического тока. В США, ЕС и Китае стандартная частота переменного тока различна. Но во всех случаях она незначительно варьируется в зависимости от нагрузки на электросеть, и этого достаточно, чтобы привязать эти колебания к конкретному месту и времени с точностью до минуты. Так, у каждой из четырех основных электросетей США и Канады есть свой особый «частотный характер», реагирующий на базовую нагрузку [406]. Сопоставив колебания фонового частотного шума записи с характерными колебаниями частот всех сетей, можно с высокой долей вероятности установить день, время и местность записи [407].
Этот пример, показывающий, что в любых записях содержится неудаляемая информация, похож на концепцию блокчейна – учетной системы, созданной для криптовалюты биткойн [408]. В общих чертах блокчейн представляет собой бессрочную историю всех взаимодействий и операций, в том числе данные, содержащиеся в информации. Таким образом, вместе с любой информацией передается ее полная история, и ее нельзя разделить, подделать или уничтожить. Блокчейн регистрирует текущего владельца каждого биткойна и не дает возможности одновременно использовать один и тот же биткойн в разных транзакциях, даже несмотря на то что многие пользователи биткойна предпочитают присваивать своим «кошелькам» псевдонимы. Система организована таким образом, что каждая транзакция открыто регистрируется в рамках децентрализованного распределенного процесса, а знакомиться с записями и создавать новые может любой участник. В основе идеи лежит простой факт: как только единица информации получила распространение, ее невозможно уничтожить в экзистенциальном смысле, поскольку ее копии присутствуют во всех устройствах сети. Любой перевод и обмен прозрачны, и их можно отследить во времени. Более того, в блокчейн можно вписывать комментарии, создавая контекст транзакции [409].
Частный блокчейн может быть создан группой людей или организацией, так называемым консорциумом, все члены которой получают полный доступ к истории и возможность создания записей [410]. Это интересный вариант для медицинской информации: доступ пациента к записям в карте с возможностью изменений и дополнений может быть ограничен лечащими врачами, консультантами и отдельными членами семьи. Полностью публичный блокчейн более прозрачен и надежен, поскольку аутентичность информационных транзакций подтверждается всей пользовательской сетью. Любые попытки что-то сфальсифицировать сразу обратят на себя внимание. В то же время благодаря меньшему количеству участников, подтверждающих и сохраняющих транзакции, в консорциуме выше скорость прохождения операций. Это же обстоятельство упрощает и возможность сговора, поэтому в консорциуме следует проявлять повышенную бдительность. Присутствие в системе истории всех транзакций позволяет любому блокчейну, публичному или частному, достичь беспрецедентного уровня ответственности и подотчетности, что может быть особенно важно в случае попыток злонамеренного использования информации. Блокчейн можно считать высокотехнологическим эквивалентом суперклея: информация о любых изменениях и дополнениях надежно увязывается с их авторами.
Из предыдущей главы мы знаем, что при расчете информационных инвестиций так называемые явные данные, предоставление которых требует больших усилий пользователя, оцениваются выше. Исправления и дополнения являются явными данными, но могут быть приобщены к данным любого типа, как явным, так и неявным. Исправляя неявные данные, например указывая на некоторую неточность метаданных фотографии, вы повышаете их вес в расчете доходности информационных активов и обозначаете свой интерес к другим подобным корректировкам.
Наконец, воплощение в жизнь права на изменения потребует от инфопереработчиков предоставить пользователям необходимые ресурсы. Идея сфокусировать внимание пользователя на потенциальных областях заработка инфопереработчика, таких как, например, реклама, может выглядеть слишком соблазнительно. Но необходимыми первыми шагами в обеспечении интересов пользователей должно стать предоставление им виртуальных площадок для внесения изменений и создание архитектуры, обеспечивающей их публичность.
Читать дальшеИнтервал:
Закладка: