Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Тут можно читать онлайн Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - бесплатно полную версию книги (целиком) без сокращений. Жанр: comp-db, издательство АСТ, год 2016. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
  • Автор:
  • Жанр:
  • Издательство:
    АСТ
  • Год:
    2016
  • Город:
    Москва
  • ISBN:
    978-5-17-088935-8
  • Рейтинг:
    5/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 100
    • 1
    • 2
    • 3
    • 4
    • 5

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры краткое содержание

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - описание и краткое содержание, автор Жан-Батист Мишель, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - читать онлайн бесплатно полную версию (весь текст целиком)

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - читать книгу онлайн бесплатно, автор Жан-Батист Мишель
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Книги в своем физическом виде находятся под угрозой даже в своей привычной цитадели – библиотеке [200]. На протяжении тысячелетий библиотека была единственным учреждением, призванным сохранять исторические записи. Однако в отличие от активно развивающихся онлайн-библиотек, их традиционные физические сородичи сталкиваются с большими проблемами. Через несколько лет у 60% библиотек бюджет снизится или вообще исчезнет. При отсутствии достаточного объема площадей и финансов библиотекам придется избавляться от целого ряда старых книг, чтобы выделить место для новых. Проблема состоит в том, что библиотеки не могут просто раздать свои старые книги. В библиотечные книги встроены специальные устройства, препятствующие воровству. И это приведет к тому, что честные люди будут время от времени считать, что эти книги были когда-то похищены из библиотек, и приносить их обратно. Удалять эти отслеживающие устройства довольно дорого. Поэтому библиотеки часто предпочитают сделать то, что кажется нам немыслимым, – они тайно уничтожают книги. Это происходит в огромных масштабах. Крупные библиотеки иногда разом избавляются от сотен тысяч книг.

Какие же книги покидают библиотеки? Практика варьируется, однако в целом библиотеки не особенно церемонятся с книгами. Мало кто прилагает усилия для отслеживания того, что мы теряем. В одном недавнем случае были уничтожены книги из библиотеки бывшего британского премьер-министра Дэвида Ллойд-Джорджа. Время от времени библиотека будет решать, от каких книг избавиться, проверяя, какие из них уже оцифровала Google . В результате мы внезапно можем лишиться значительной доли своего культурного наследия. Несколько глав назад мы рассказали о том, как цензура способна задавить те или иные идеи. Здесь же происходит обратное – попытки сделать книги более доступными угрожают их физическому выживанию. Оцифровка книг приводит к весьма противоречивым результатам.

Газеты.Разумеется, исторические записи не ограничиваются одними лишь книгами. К примеру, «кругосветный розыгрыш» По появился в газете. Старые газеты представляют собой уникальный ресурс, в котором отражены повседневные проблемы городов, общественных движений и других социальных групп. Насколько велики шансы найти цифровое издание «кругосветного розыгрыша» По?

Поначалу мы считали, что шансы на это велики. Оцифровка старых газет приобрела значительные масштабы. К настоящему времени ведущие газеты вроде New York Times, Boston Globe и многих других уже полностью оцифровали свои архивы. Национальный фонд гуманитарных наук профинансировал оцифровку старых американских газет – около шести миллионов страниц, отражавших историю целого столетия. Прогрессировали и другие страны. В рамках одного лишь проекта Australia’s Trove было оцифровано около ста миллионов газетных статей. Этой деятельностью в течение какого-то периода занималась и Google , оцифровав архивы двух тысяч газет [201].

Однако, несмотря на эти впечатляющие шаги, никакие усилия по оцифровке газет не сопоставимы по масштабу и покрытию с книжным проектом Google .

Идеальным примером этого неравенства может считаться «кругосветный розыгрыш» По. Найти цифровое издание этого розыгрыша несложно. Однако это связано с успехом оцифровки книг, а не газет. Хвост этой истории настолько велик, что рассказ о ней возникает во множестве книг, описывающих жизнь и работу По. Эти книги, как и книги самого По, уже были оцифрованы.

Однако вам не удастся найти цифровую копию газеты, которая изначально опубликовала эту историю. Национальный гуманитарный фонд профинансировал оцифровку выпусков нью-йоркской газеты Sun лишь за период с 1859 по 1920 год. Розыгрыш, опубликованный в 1844 году, оказывается очередным «белым пятном» в процессе оцифровки газет. Основная масса газетных статей, написанных По, не оцифрована, и никто не знает, когда это будет сделано.

Неопубликованные тексты.Книгопечатание представляет собой сравнительно недавнее изобретение. До появления печатного станка тексты распространялись в виде рукописей, написанных и скопированных от руки. В наши дни множество прекрасных текстов выживает лишь в этой форме. Многие знаменитые рукописи, наподобие манускриптов Мертвого моря, уже были оцифрованы, также как и другие важные коллекции, например греческие рукописи в Британской библиотеке. Однако систематические усилия по оцифровке рукописей предпринимаются лишь на местном уровне [202].

Разумеется, создание неопубликованных текстов не остановилось с появлением книгопечатания. После По осталось 422 письма. В его случае письма были оцифрованы, однако история напоминает то, что приключилось с его «кругосветным розыгрышем»: письма По подверглись цифровой обработке только потому, что он был очень знаменит и они упоминались во множестве источников. Другие материалы самого По и других авторов о нем были оцифрованы в рамках любительских проектов (например, проекта Austin’s Harry Ransom Center в университете штата Техас). В университете можно найти цифровые изображения отдельных рукописей По, адресованных ему писем и некоторых незаконченных произведений. Образ Эдгара Аллана По можно увидеть даже на карточках-вкладышах в сигаретные пачки. До наступления тех времен, когда определенную культурную нишу в США заняли карточки с изображениями бейсболистов, многие актеры, модели и писатели вносили свой посильный вклад в стимулирование продаж табака.

Но когда речь заходит о неопубликованном материале, наследие По оказывается значительно менее репрезентативным. Люди вроде него имеют звездный статус. Почти все, связанное с ними, будет найдено и оцифровано. А что насчет всех остальных? Заметки, журналы и переписка 99% других людей пылится на чердаках и в старых сундуках. Разобраться с ними крайне сложно, и усилия по их оцифровке представляют собой редкие исключения.

Один из немногих примеров успешной попытки разобраться с материалом такого рода был предпринят Афсане Наджамбади, преподавательницей из Гарварда, изучающей иранских женщин. Она буквально ходила от двери к двери в иранских городах, спрашивая жителей о том, не сохранились ли у них какие-нибудь исторические документы, связанные с жизнью женщин. Затем она тщательно создавала цифровые образы всего, что удавалось найти. Результат – архив под названием «Миры женщин в Иране при династии Каджаров» – открыт в свободном доступе по адресу: http://www.qajarwomen.org. Это настоящая сокровищница всего, от завещаний до почтовых открыток и брачных контрактов. Подобные сокровища имеются во всех обществах. Однако время медленно убивает их.

И, как ни печально, для остановки этого процесса не предпринимается никаких систематических усилий.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Жан-Батист Мишель читать все книги автора по порядку

Жан-Батист Мишель - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры отзывы


Отзывы читателей о книге Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры, автор: Жан-Батист Мишель. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x