Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Тут можно читать онлайн Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - бесплатно полную версию книги (целиком) без сокращений. Жанр: comp-db, издательство АСТ, год 2016. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
  • Автор:
  • Жанр:
  • Издательство:
    АСТ
  • Год:
    2016
  • Город:
    Москва
  • ISBN:
    978-5-17-088935-8
  • Рейтинг:
    5/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 100
    • 1
    • 2
    • 3
    • 4
    • 5

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры краткое содержание

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - описание и краткое содержание, автор Жан-Батист Мишель, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - читать онлайн бесплатно полную версию (весь текст целиком)

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - читать книгу онлайн бесплатно, автор Жан-Батист Мишель
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

63

Дети осваивают неправильные глаголы особенно интересным образом, постепенно, по мере развития мышления. Поначалу они спрягают все глаголы по-своему. Затем они начинают признавать правила языка, на котором говорят люди вокруг. Когда они понимают, что большинство глаголов следует правилу – ed , то переходят на стадию, называемую «гиперкорректностью», при которой воспринимают каждый глагол как правильный и используют формы типа goed, knowed и runned ( от глаголов go – «идти», know – «знать» и run – «бежать»). Со временем они понимают, что некоторые глаголы представляют собой исключения из правила – ed , и начинают включать «правильные» неправильные формы в свою речь.

64

По этой теме имеется масса интересной литературы. См., к примеру, Sabeti P. C. et al. Detecting Recent Positive Selection in the Human Genome from Haplotype Structure // Nature 419, no. 6909 (2002). P. 832–837. Доступно в сети Интернет: http://goo.gl/TW6SYJ. Varilly P. et al. Genome-Wide Detection and Characterization of Positive Selection in Human Populations // Nature 449, no. 7164 (2007). P. 913–918. Доступно в сети Интернет: http://goo.gl/NfnzeU.

65

К примеру, к этим источникам относятся Emerson Oliver Farrar. A Middle English Reader. New York: Macmillan, 1909, и Sweet Henry. An Anglo-Saxon Primer. Oxford: Clarendon Press, 1887.

66

Изначально эта работа была опубликована в форме статьи Lieberman Erez et al. Quantifying the Evolutionary Dynamics of Language // Nature 449 (11 октября 2007 г.). P. 713–716. Доступно в сети Интернет: http://goo.gl/3kCMQT.

67

См. Radioactive Decay // Wikipedia (22 июня 2013 г.), доступно в сети Интернет: http://goo.gl/xTYh1; Half-life // Wikipedia (3 июня 2013 г.), доступно в сети Интернет: http://goo.gl/TXn3.

68

Период полураспада неправильного глагола, имеющего ту же частоту, что и drove , составляет 5400 лет, что равнозначно ожидаемому сроку жизни до выравнивания (перехода в правильную форму) на уровне около 7800 лет.

69

Сияние происходит не только от прикосновений. Многие старшекурсники мочатся на этот ботинок; в 2013 году 23% выпускников Гарварда признавались, что делали это хотя бы однажды. Это представляет собой один из «основных трех» ритуалов инициации для гарвардских старшекурсников. Второй ритуал связан с обнажением и воплями на публике (и известен под названием «первобытный вопль»). Третий ритуал проводится в библиотеке и предполагает использование книг в качестве весов для силовых тренировок (и понятно, что в данном случае Kindle не может служит заменой тяжелому фолианту). См. Zauzmer Julie M. Where We Stand: The Class of 2013 Senior Survey // Harvard Crimson (28 мая 2013), доступно в сети Интернет: http://goo.gl/1EpfA.

70

В 1980 году Буса опубликовал описание своего сотрудничества с IBM , продолжавшегося несколько десятилетий. Это поистине пророческий документ, содержащий множество глубоких замечаний для дальнейшего осмысления. К примеру, предвидя необходимость реформы гуманитарных наук (см. также наше обсуждение этого вопроса в главе 7), Буса пишет: «Представляется, что нынешняя научная жизнь нацелена на проведение краткосрочных исследовательских проектов и быструю публикацию результатов, а не на проекты, требующие совместной командной работы, предполагающей скорее продвижение на один сантиметр в глубину и километр в ширину, чем на километр исследований при сантиметровом их основании». Более тридцати лет спустя Энтони Графтон, занимавший в то время пост президента Американской ассоциации историков, высказал похожую мысль: «По мере того как новые формы научного исследования предлагают историкам исследовательские методы, дополняющие работу с текстами, поскольку цифровые архивы становятся все более масштабными, а цифровые исследовательские методы становятся все более доступными, историкам придется учиться тому, как формировать команды и работать в них… Сотрудничество предлагает – потенциально очень мощный – способ работы для ученых традиционного склада. Они могут создавать глобальные истории экономических, культурных и политических отношений, построенные на мощной архивной и текстовой основе». Работа Бусы, которую можно считать манифестом движения за цифровые методы в гуманитарных науках, не теряет своей актуальности и по сей день. См. Busa R. The Annals of Humanities Computing: Index Thomisticus // Computers and the Humanities 14 (1980). P. 83–90. Доступно в сети Интернет: http:// goo.gl/FgVWQ. Grafton A. Loneliness and Freedom // Perspectives on History (март 2011 г.), доступно в сети Интернет: http://goo.gl/dOx3J.

71

Некоторые конкордансы оказываются мощнее других. Следует отметить, что, даже если оставить в стороне вопрос более сложного исходного источника, конкорданс Бусы значительно масштабнее конкорданса Реймер. К примеру, Index Thomisticus включает в себя полную лемматизацию (приведение всех словоформ к единой словарной форме) исходного текста, группирующую все слова в лексически связанные классы (в английском языке лемматизация предполагает группировку различных родственных слов типа run, running, runs, ran, outrun и also - ran под одним заголовком). Эта лемматизация сама по себе выглядит значительным достижением. Наборы списков данных, с которыми мы работали, не содержат лемматизации (ее очень сложно провести правильно).

72

См. Miller G. A. Introduction to The Psycho-Biology of Language. Cambridge, MA: MIT Press, 1965, доступно в сети Интернет: http://goo.gl/KYvOcK. Полная цитата из введения к изданию книги 1965 года кажется теперь актуальной, как никогда раньше: «Цель книги The Psycho - Biology of Language („Психобиология языка“) состоит в не том, чтобы удовлетворить всем вкусам. Ципф был из той породы людей, которые разделяют розы на части, чтобы посчитать их лепестки; если вы считаете кощунством переставление местами слов в шекспировском сонете и их подсчет, то эта книга не для вас. Ципф относился к языку как ученый – и для него это означало статистический анализ языка как биологического, психологического и социального процесса. Если такой анализ отталкивает вас, то оставьте язык в покое и бегите от Джорджа Кингсли Ципфа как от чумы. Вам будет куда приятнее читать цитаты Марка Твена: „Существует три вида лжи: ложь, наглая ложь и статистика“ или У. Х. Одена: „Да не будешь ты сидеть рядом со статистиками или заниматься социальными науками“. Однако тем, кто не побоится убить красоту ради благого дела, научные старания Ципфа помогут прийти к прекрасным и неожиданным результатам, поражающим разум и дразнящим воображение».

73

См. Jenkins Sally. Burned-out Phelps Fizzles in the Water Against Lochte // Washington Post (29 июля 2012 г.).

74

См. Rohlin Melissa. Kobe Bryant Says He Learned a Lot from Phil Jackson // Los Angeles Times (14 ноября 2012 г.), доступно в сети Интернет: http://goo.gl/bKGDTg.

75

См. обсуждение этого вопроса в книге Pinker Steven. Words and Rules: The Ingredients of Language. New York: Basic Books, 1999; статье Lieberman et al. Quantifying the Evolutionary Dynamics of Language и вспомогательных материалах к ней; Michel2011 и Michel2011S.

76

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Жан-Батист Мишель читать все книги автора по порядку

Жан-Батист Мишель - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры отзывы


Отзывы читателей о книге Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры, автор: Жан-Батист Мишель. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x