Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Тут можно читать онлайн Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - бесплатно полную версию книги (целиком) без сокращений. Жанр: comp-db, издательство АСТ, год 2016. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
  • Автор:
  • Жанр:
  • Издательство:
    АСТ
  • Год:
    2016
  • Город:
    Москва
  • ISBN:
    978-5-17-088935-8
  • Рейтинг:
    5/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 100
    • 1
    • 2
    • 3
    • 4
    • 5

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры краткое содержание

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - описание и краткое содержание, автор Жан-Батист Мишель, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - читать онлайн бесплатно полную версию (весь текст целиком)

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - читать книгу онлайн бесплатно, автор Жан-Батист Мишель
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Подобные истории с одним и тем же процессом можно создать для каждого года. Описанная нами история любви и утраты заметна на каждом из графиков, однако в этом нет ничего удивительного. Более неожиданными оказываются другие свойства этих графиков.

Одним из них является общая форма кривых забывания Судя по всему процесс - фото 31

Одним из них является общая форма кривых забывания. Судя по всему, процесс забывания состоит из двух этапов – интерес к определенному году сначала быстро падает в первые несколько десятилетий, а затем темп падения замедляется. Сходные вещи возникают и в отношении коллективного и индивидуального вспоминания – общество имеет как краткосрочную, так и долгосрочную память.

Мы можем задаться количественным вопросом. Например, при изучении краткосрочной памяти общества мы можем спросить: насколько быстро лопается пузырь? Иными словами, как быстро люди теряют интерес к определенному году после его завершения?

Простое решение этой проблемы заключается в подсчете времени, которое требуется для снижения до половины пикового значения частоты упоминания года, – то есть сколько времени составляет период полураспада коллективной памяти. Это значение сильно различается от года к году. Частота упоминаний 1872-го снизилась до половины своего пикового значения в 1896 году, то есть через 24 года. Напротив, частота упоминаний 1973-го снизилось до величины половины пика к 1983 году, всего лишь через 10 лет.

Более быстрое снижение 1973-го представляет собой симптом более общего порядка – с течением времени период полураспада коллективного забывания становится все короче и короче. Это наблюдение говорит нам об изменении отношения общества к прошлому. Мы все быстрее и быстрее теряем интерес к давно случившимся событиям.

Что привело к такому изменению? В точности неизвестно. Пока что у нас есть лишь примеры голой корреляции – то есть того, что мы открываем, глядя на коллективную память через цифровую линзу нашего нового «скопа». Возможно, для того чтобы разобраться с механизмом работы, нам потребуется некоторое время.

Это – крайняя граница науки. У нас нет карт, нам приходится идти наугад, и перед нами множество тупиков, но мы не променяли бы это место ни на какое другое.

Долой старое, да здравствует новое

Разумеется, наше коллективное сознание способно не только забывать. Если мы хотим понять смысл коллективной памяти, нам нужно разобраться и с другой стороной медали. Каким образом новая информация проникает в общество?

Мы думаем о нынешней эпохе как об информационной – о периоде, отмеченном поразительной скоростью перемещения информации от человека к человеку и из одного места в другое. Однако мы часто не замечаем, насколько быстро передавалась чистая информация в прошлые столетия с помощью механизмов, возможности которых кажутся нам теперь скудными [173]. К примеру, в Лондоне XVII и XVIII веков обычная почта могла поступать к адресату до пятнадцати раз в день. Письма, отправленные утром, прибывали в течение четырех часов. Конечно, это не так быстро, как электронная почта в наши дни, но и не так медленно, как оставшаяся в наши дни традиционная почта (к XIX столетию лондонцы могли отправлять посылки по всему городу на скорости до 25 миль в час с помощью заброшенной в наши дни системы пневматической почты). На протяжении столетий люди находили массу способов распространять серьезные новости достаточно быстро.

Книги – это нечто другое. Конечно, они представляют собой важный источник информации, однако работа над большинством книг – это серьезное предприятие, а для создания и публикации книги могут потребоваться многие годы. Книги – слишком медленный источник для важных и срочных новостей.

Зачастую это не вызывает проблем. Поскольку коллективное забывание – как минимум забывание самых важных вещей – происходит сравнительно медленно, на протяжении многих лет, десятилетий и столетий, мы вполне можем создавать на основе данных из книг свои n -грамы.

Однако множество вещей входит в коллективное сознание быстро – за считаные дни, недели, месяцы или немногие годы. Для того чтобы n -грам 1872 года перешел от «никакого» состояния до пика популярности, потребовался всего год. Для Перл-Харбора этот срок составил один день. Проблема состоит в том, что n -грамы, связанные с книгами, не особенно полезны при оценке столь быстрых процессов. Для того чтобы сфотографировать быстро летящий мяч, нужна специальная фотокамера. Поэтому если мы хотим использовать n -грамы для того, чтобы что-то узнать о процессе обучения, нам нужно посмотреть на что-то, что перемещается медленнее крупных новостей.

Эврика

Авива, жена Эреца Эйдена, начала изучать подход к коллективному обучению, который показался нам особенно многообещающим. Она принялась изучать изобретения. Успешные изобретения представляют собой подлинное воплощение коллективного обучения. Они отражают способность общества создавать новое знание о мире и адаптировать передовые научные и инженерные разработки для преодоления повседневных сложностей. Именно по этим причинам для распространения изобретений требуется больше времени, чем для обычных новостей.

Важнейшее отличие состоит в том, что изобретение – это не просто информация в чистом виде, которую можно легко сообщить в электронном письме или отправить с курьером. Для того чтобы общество восприняло новую технологическую идею, нужны и инженерное ноу-хау, позволяющее создать изобретение, и технические навыки для его применения, и экономическая модель для продаж и распространения, и инфраструктура, позволяющая перевозить изобретение. В отличие от слов о заслуживающем внимания событии, для распространения изобретения могут потребоваться десятилетия.

Исследовать эти длинные временные шкалы с помощью n грамов довольно легко - фото 32

Исследовать эти длинные временные шкалы с помощью n -грамов довольно легко. Отличным примером может служить факсимильный аппарат.

В 1980-х годах почти моментально выскакивает «факс-машина», сразу же достигая пика популярности. Кажется, что это – стопроцентная новинка. Когда же, если судить по n -грамам, был изобретен факс?

80-е, правильно? Нет. 70-е? Нет. 60-е? 50-е? 40-е?

Да, факс-машина была изобретена в сороковых. Но первый патент на факс-машину был выдан шотландскому изобретателю Александру Бейну в 1843 году. К 1865 году между Парижем и Лионом уже существовала коммерческая служба – так называемый телефакс [174].

Одна из самых поразительных технологий 1980х годов получила поддержку - фото 33

Одна из самых поразительных технологий 1980-х годов получила поддержку Наполеона III, императора Франции. Крупные новости путешествуют быстро – в отличие от больших идей.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Жан-Батист Мишель читать все книги автора по порядку

Жан-Батист Мишель - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры отзывы


Отзывы читателей о книге Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры, автор: Жан-Батист Мишель. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x