Андреас Вайгенд - BIG DATA. Вся технология в одной книге
- Название:BIG DATA. Вся технология в одной книге
- Автор:
- Жанр:
- Издательство:Литагент 5 редакция
- Год:2018
- ISBN:978-5-04-094117-9
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Андреас Вайгенд - BIG DATA. Вся технология в одной книге краткое содержание
BIG DATA. Вся технология в одной книге - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
На самом деле нет ничего важнее запроса на информацию для людей. Социальные данные – самое ценное сырье XXI века, новая нефть [22]. Такая аналогия представляется вполне уместной по целому ряду причин. На протяжении более чем ста лет нашу экономику и общественно-политическую жизнь во многом определяли нефть и развитие технологий ее добычи, хранения и переработки в продукцию, потребляемую каждым жителем планеты. Сегодня возможность переработки персональных данных в продукты и услуги привносит в жизнь человечества изменения, сопоставимые с эффектом промышленной революции.
Нефть не используется в ее первичном состоянии. Ее нужно переработать в автомобильное горючее, пластмассы и многие другие продукты нефтехимии. В свою очередь нефтепереработка дала толчок развитию техники индустриальной эпохи и сыграла важную роль в производстве подавляющего большинства видов физической продукции современной экономики. Схожим образом и первичные персональные данные сами по себе являются достаточно бесполезными. Данные приобретают ценность в результате переработки – агрегирования, анализа, сравнения, фильтрации и дистрибуции новых информационных продуктов и сервисов. В отличие от продукции нефтепереработки, продукты переработки данных становятся основой не индустриальной революции, но революции социальных данных.
К счастью, информация как ресурс радикальным образом отличается от нефти. Запасы нефти на планете конечны, и по мере истощения этого ресурса его эксплуатация обходится все дороже. Количество же информации, напротив, растет в геометрической прогрессии, а стоимость технологий ее передачи и обработки неуклонно снижается. По состоянию на конец 2015 года смартфонами пользовались более половины совершеннолетних граждан [23]. Среднестатистический американец проводит в разговорах по мобильному телефону примерно два часа в день [24]. По существующим оценкам, в течение дня люди прикасаются к своим телефонам от двухсот до трехсот раз – едва ли не чаще, чем большинство из нас прикасается к своей партнерше за месяц [25]. Информация, в отличие от нефти, не иссякнет никогда.
Использование нефти ограничено факторами ее дефицита и вещной формы, а использование информации практически не ограничено, учитывая ее изобилие и цифровую форму. Конкретный объем сырой нефти может быть использован для переработки в готовую продукцию лишь единственным владельцем, тогда как одним и тем же информационным массивом могут одновременно пользоваться и превращать его в разнообразные продукты многие. В основе наших законов и социальных норм лежит идея дефицитности информации. Так, например, отсутствие информационного поля породило страхование как способ защиты от неприятностей и материальных потерь, связанных с чрезвычайными жизненными обстоятельствами. Поскольку возможность точно рассчитать вероятность заболевания диабетом или ограбления для каждого конкретного человека отсутствовала, страховщики делили людей на группы риска и устанавливали для каждой из них среднюю ставку страховых взносов. По мере роста объема информации мы сможем прогнозировать риск для каждого конкретного человека и индивидуализировать суммы страховых взносов. Можно делать вид, что данных не существует, но можно признать факт их наличия и задуматься над тем, как это может изменить нашу жизнь. Какой мир нам хотелось бы создать при помощи этого нового вида ресурсов?
Богатый потенциал возможностей новых технологий можно раскрыть при наличии соответствующих инструментов. До изобретения Гутенбергом печатного станка книг было мало, а доставка новостей жителям отдаленных местностей обходилась дорого. Большая часть населения не извлекала никакой выгоды от долгих часов, потраченных на обучение чтению. Профессор психологии Принстонского университета Джордж Миллер писал о современных стандартах грамотности еще до изобретения интернета. Его беспокоило, что слишком многие ученики не достигают в чтении, математических и научных дисциплинах того уровня навыков, которые необходимы для получения работы в экономике «интеллектуальных услуг» [26]. Я считаю, что сегодня налицо другая, не менее насущная потребность в грамотности нового типа – информационной. Она подразумевает понимание процесса переработки информации, знание изменяемых и неизменяемых параметров, умение интерпретировать ошибки и понимать возможные последствия передачи информации о себе. Для мира, где большую часть наших решений будут направлять рекомендации, полученные на основе обработки социальных данных, такая грамотность является обязательной.
Неудивительно, что одним из первых «инфоперерабатывающих заводов» стало предприятие розничной торговли – компания Amazon. Преуспевающий магазин обязан знать, какие товары, интересующие потенциальных покупателей, должны быть в наличии, а для этого нужно отслеживать данные о товарообороте, ценах, рекламе и потребительских предпочтениях своей целевой аудитории.
Двести лет назад практически вся информация, нужная хозяину магазина, заключалась в данных об остатках товара на полках и денег в кассе. По окончании каждого торгового дня эти данные вписывали чернильной ручкой в гроссбух. При выборе покупок из примерно одинакового ассортимента в одной и той же ценовой категории покупатель руководствовался информацией о надежности, привлекательностью упаковки или же мнением друзей, соседей и родственников. Примерно 150 лет назад несколько компаний, самыми известными из которых были Montgomery Ward и Sears & Roebuck Company, порадовали жителей провинциальных американских городков каталогами для заказа товаров почтой. Эти инноваторы своего времени знали, что именно обычно заказывает конкретный покупатель и куда ему доставляют товары, и поэтому могли определять уровень спроса на отдельные виды продукции в разрезе регионов. Сто лет назад, для того чтобы прогнозировать спрос и оптимизировать товарные запасы, компании, занимавшиеся торговлей по каталогам, открывали и шоурумы, и обычные магазины, а также держали целые армии аналитиков, прочесывавших статистику продаж [27]. Спустя еще пятьдесят лет в розничной торговле опять произошли важные перемены. С появлением системы почтовых индексов в США рассылочным фирмам и их торговым точкам стало проще отслеживать особенности своих потребителей [28]. В течение двух следующих десятилетий компании смогли собрать подробную демографическую информацию о людях, проживающих в различных географических областях. А вошедшие в обиход американцев с середины 1960-х годов кредитные карточки позволили собирать данные о покупках конкретного потребителя. До наступления эпохи интернета это был предел детализации личных данных – где человек живет и сколько и где он тратит.
Читать дальшеИнтервал:
Закладка: