Андреас Вайгенд - BIG DATA. Вся технология в одной книге
- Название:BIG DATA. Вся технология в одной книге
- Автор:
- Жанр:
- Издательство:Литагент 5 редакция
- Год:2018
- ISBN:978-5-04-094117-9
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Андреас Вайгенд - BIG DATA. Вся технология в одной книге краткое содержание
BIG DATA. Вся технология в одной книге - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Инфопереработчикам, анализирующим сенсорные данные, придется все чаще обращать внимание на необходимость обеспечить оптимальное соотношение выгод для подавляющего большинства пользователей и потенциального вреда, который может быть причинен людям, даже не подозревающим, что их передвижения отслеживаются. Компания Jetpac, основанная в 2011 году и в 2014 году поглощенная Google, занимается идентификацией и классификацией фотоконтента с целью создания справочника, поиск в котором можно осуществлять по определенным признакам. Программное обеспечение компании развивается на основе общедоступных фото из Instagram (150 миллионов из 6000 городов по всему миру [273], многие из которых снабжены геометками, хэштегами или подписями [274]. Если на фото, сделанных в каком-то определенном месте, много дам с накрашенными губами, приложение определит его как «шикарное» [275]. Такая информация поможет людям решить, подойдет им данное место или нет.
В Jetpac решили использовать свой софт распознавания объектов для создания списка «лучших хипстерских баров мира». Аналитики компании определили, что индикатором количества хипстеров, тусующихся в определенном месте, может служить количество усатых мужчин на фото. Оказалось, что самое большое количество хипстеров обитает в Турции. Но ведь этого не может быть! Тут аналитики Jetpac сообразили, что турецкие мужчины гораздо чаще отращивают усы, чем американские. Им пришлось привести данные в соответствие с местной спецификой, указывая различные исходные параметры для каждого из географических регионов. Это хороший пример функционирования принципов обратной связи между людьми и компьютерами в процессе анализа данных.
Другие открытия Jetpac на основе анализа фото в Instagram породили более щекотливые вопросы. Так, в Jetpac обнаружили, что на основе имеющихся данных можно составить список гей-баров в Тегеране [276]. Это могло бы быть полезным иранцу соответствующей сексуальной ориентации, но в случае обнаружения такого списка религиозными властями страны последствия для гей-сообщества были бы ужасными [277]. Кроме того, если это получилось у Jetpac, власти наверняка могут сделать то же самое.
Профессор МТИ Уильям Т. Фримен с коллегами разработал алгоритм, позволяющий измерять пульс человека по пиксельным изменениям окраски кожи на открытых участках его тела. После демонстрации результатов команду завалили просьбами предоставить программу, и ее выложили в интернет, разрешив свободно использовать в некоммерческих целях. Одна из просьб исходила от профессионального игрока в покер, который хотел получить возможность определять, блефует ли его партнер, по ускорению его пульса [278].
Более того, кардиологи установили, что ритмы сердца человека – то есть ЭКГ – столь же уникальны, как отпечатки пальцев или строение радужной оболочки глаза, причем фальсифицировать их намного сложнее. Эту информацию использовали MasterCard, Royal Bank of Canada и английский Halifax Bank, протестировавшие ЭКГ-браслет, предназначенный для удостоверения личности в банкоматах, интернет-банках и при совершении бесконтактных платежей [279]. Браслеты, созданные на основе патентованных методик измерения, регистрации и верификации сердечных ритмов, производит компания Bionym из Торонто [280].
Данные, собираемые триллионами сенсорных датчиков по всей планете, находятся вне нашего контроля. Сооснователь и главный технолог Jetpac Питер Уорден пытался оценить, насколько технологии распознавания лиц повлекут за собой фундаментальные изменения балансов между приватностью и безопасностью и между приватностью и гласностью [281]. С одной стороны, компании ищут более надежные способы защиты конфиденциальной информации и все чаще просят людей использовать биометрические данные в качестве уникального средства доступа к отдельным услугам или для обеспечения безопасности. С другой стороны, большая часть социальных данных создается в сотрудничестве между людьми в ходе совместных занятий по интересам или взаимоотношений. Контроль за сбором информации в целях защиты частной жизни человека потребовал бы установления режима своего рода полицейского государства, в котором были бы ограничены многие другие права на самовыражение.
К тому же три основных варианта защиты от нежелательного использования сенсорных данных далеки от совершенства. Криптографические средства, разрешающие доступ к данным только обладателям электронных ключей, не годятся в большинстве случаев распространения информации, например при размещении фото в Instagram. Социальные нормы, определяющие уместность распространения и использования информации, не защищают от злоумышленников. Остается защита, предусмотренная законодательными нормами. Срок в двадцать лет, потребовавшийся Луису Брэндису для законодательного закрепления права на неприкосновенность частной жизни, наглядно демонстрирует медлительность, с которой закон реагирует на технологический прогресс. В то же время относительная стабильность юридической системы является преимуществом в случае, когда нужно выделить обширные области информации, использование которой является оскорбительным и неприемлемым, например информации о расовой и гендерной принадлежности, сексуальной ориентации и болезнях. Я надеюсь, что общественность продолжит расширять этот список по мере развития использования социальных данных.
Однако простого расширения этого списка недостаточно. Нужны инструменты, позволяющие установить, что дискриминация была обусловлена использованием социальных данных. Каждый запрос к базе данных является единицей информации, используемой инфопереработчиками в целях совершенствования своих продуктов и сервисов, и эти данные тоже могут быть задействованы для обеспечения нашей безопасности. Важность этой задачи будет расти по мере того, как алгоритмы начнут применяться не только для определения нашего физического местопребывания, но и для выводов о том, в каком состоянии духа мы находимся.
Делом всей жизни почетного профессора психологии Калифорнийского университета в Сан-Франциско Пола Экмана стало измерение физиологического воздействия шести основных эмоций: гнева, печали, страха, неприязни, удивления и счастья. Он начинал с изучения реакций жителей пяти разных стран – Чили, Аргентины, Бразилии, Японии и США – на фото с изображением эмоциональных ситуаций. Он ожидал, что реакции будут носить отпечаток культурной среды, но оказался не прав. В каждом из опытов он наблюдал похожие выражения лиц: насупленные брови при гневе, опущенные уголки губ при печали, наморщенный нос при отвращении, прищур глаз при искренней улыбке. (В вежливой, но деланой улыбке участвуют только губы.) В 1978 году Экман и его коллега Уоллес В. Фризен свели все наблюдения в Систему кодирования лицевых движений (СКЛиД) [282]. На основе СКЛиД был осуществлен ряд разработок программного обеспечения распознавания лиц [283].
Читать дальшеИнтервал:
Закладка: