Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Тут можно читать онлайн Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - бесплатно полную версию книги (целиком) без сокращений. Жанр: comp-db, издательство АСТ, год 2016. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
  • Автор:
  • Жанр:
  • Издательство:
    АСТ
  • Год:
    2016
  • Город:
    Москва
  • ISBN:
    978-5-17-088935-8
  • Рейтинг:
    5/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 100
    • 1
    • 2
    • 3
    • 4
    • 5

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры краткое содержание

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - описание и краткое содержание, автор Жан-Батист Мишель, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - читать онлайн бесплатно полную версию (весь текст целиком)

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - читать книгу онлайн бесплатно, автор Жан-Батист Мишель
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Однако существуют и более здоровые подходы к «духу народа». Немецко-американский ученый Франц Боас [182], которого часто называют отцом современной антропологии, говорил в своей работе об историческом определении «духа народа». Однако он категорически отказывался смешивать «дух народа» и ультранационалистическую идеологию, понимая, что это опасное слияние приведет к интеллектуальному и моральному обеднению [183].

Вместо этого он попытался выявить «дух народа» эмпирическими методами (теми же самыми, которыми руководствовался Эббингауз). С точки зрения Боаса, культура постоянно меняется, однако при этом всегда допускает наблюдения и описание ее фактов. Объединив две традиции, Боас заложил основы научного исследования культуры и создал то, что мы в наше время называем антропологией.

И когда мы в разговоре с учеными называем свои занятия словом «культуромика», мы каждый раз вспоминаем о Боасе.

«-омика» предполагает работу с большими данными в современной биологии и не только [184].

«Культура» – это культура в понимании Боаса, эмпирически познаваемая и многогранная, основанная на бесконечной любознательности и искреннем восхищении.

2010 год. В затемненной комнате штаб-квартиры гарвардской программы «Эволюционная динамика» на столе стоит компьютер со снятым защитным корпусом. Юань только что вернулся из офиса Google в Кембридже и привез с собой жесткие диски с данными n -грамов. Эти результаты были получены всего несколькими часами ранее. Подсоединив диски, мы нажали на кнопку включения компьютера, приготовившись увидеть результаты трех лет своей работы. Единственным звуком в те минуты, пока компьютер загружался, было успокаивающее жужжание вращающихся дисков.

И вот наконец на экране появилась командная строка.

С чего начать?

«Эволюция» – то, что привело нас туда, где мы оказались

Прошла еще минута, на экране появилось несколько строк программы, и вдруг командная строка сменилась графиком. Мы увидели, как через плавную и тонкую линию с нами начинают говорить миллионы голосов через столетия. Кривая, возникшая из океана данных, нарисовала нам простую, но впечатляющую историю, понять которую мог бы каждый.

Поднялся одобрительный гул. Увиденное представляло собой вполне наглядный пример действия эволюции.

И тут же в комнате раздался еще один звук звук откупориваемой бутылки вина - фото 37

И тут же в комнате раздался еще один звук – звук откупориваемой бутылки вина.

Первая выборка всегда бесплатна

В прошлом мы активно пытались убедить людей из Google , что создание общедоступного инструмента для изучения n -грамов (который мы предложили назвать Bookworm , то есть «Книжный червь») представляет собой хорошую идею. Нас быстро ставили на место, задавая вопросы типа «Кто будет его использовать? Преподаватели. Теперь представьте себе, что каждый преподаватель в мире пользуется Bookworm и таких людей 100 тысяч. В масштабах Google 100 тысяч пользователей не способны ни на что повлиять».

Спорить с этим было сложно.

Однако как только у нас оказались данные и мы начали с ними играть, тут же стало происходить нечто странное: n -грамы занимали в нашей жизни все больше места. Не смотреть на них было просто невозможно. Мы начали работу со слова «эволюция». А что, если посмотреть на неправильные глаголы? А как насчет президентов? Или Эйнштейна? Иногда на вечеринке нам могли задать вопрос: когда появился термин «сексизм»? Мы вытаскивали компьютер и отвечали: в начале 1970-х. Когда люди начали писать donut вместо doughnut («пончик»)? Мы вновь доставали ноутбук и отвечали: в 50-х, сразу же после создания компании Dunkin’ Donuts .

Мы стали встречаться и обсуждать научное исследование, в котором бы описали наши самые интересные открытия. Мы думали, что написание научной работы поможет нам сделать следующий шаг вперед. Но каждый раз, когда мы начинали писать на эту тему, нас отвлекал от работы новый набор n -грамов. Закуски! Компании! Динозавры! К концу каждой встречи мы понимали, что любые наши предыдущие открытия меркли в сравнении с тем, что мы проверили только что. Ситуация казалась попросту невозможной. Мы никак не могли понять, как же нам справиться с этой одержимостью.

Нам стало ясно, что для того, чтобы собраться с мыслями, потребуется помощь других. Поэтому мы взяли четыре ноутбука, имевших доступ к базе данных n -грамов, – единственные четыре ноутбука в мире, способные работать с нашим прототипом интерфейса Bookworm, – и раздали их. Один отправился к Пинкеру, который принялся быстро создавать с его помощью графики для включения в книгу, которую писал в то время. Другой ушел Авиве, жене Эреца. Она тут же сообщила о новых открытиях – проверка n -грама для фамилии Мендельсон заставила ее углубиться в изучение темы цензуры. Теперь на этот наркотик подсела и она.

Третья машина отправилась к Мартину Новаку. Как-то раз, вернувшись домой, он показал Bookworm своему сыну Себастьяну, которому в то время было 16 лет. Себастьян ввел запрос. На экране появился график. Заинтересовавшись, он попробовал еще; а после еще двух запросов он забрал машину у Мартина и удалился. Уже через несколько минут работы он позвонил другу: «Ты должен сейчас же прийти и увидеть, что у меня есть». Друг пришел, и они отправляли запрос за запросом до глубокой ночи.

Последняя машина отправилась на Библиотечный саммит 2010 года, проводившийся компанией Google . Нас пригласили сделать на этом мероприятии доклад. Именно на этом саммите Google обычно рассказывала главам многих библиотек мира о последних новостях своего проекта по оцифровке.

Наверное, вы считаете библиотекарей тихими и спокойными людьми. Мы столкнулись с обратной картиной.

После того как мы объяснили базовую концепцию того, чем занимаемся, уровень энтузиазма в зале резко возрос – никто и никогда не слышал ни о чем подобном (по крайней мере в таких масштабах). Мы смогли привлечь внимание каждого человека, находившегося в переполненном зале. Ко времени, когда мы стали показывать примеры, комната наполнилась удивительной энергией. Наконец, после 45 минут общения мы перестали разговаривать и загрузили Bookworm .

Мы поинтересовались у аудитории: «А теперь… какие мы отправим запросы?» В ответ раздались бурные аплодисменты, подобных которым мы не слышали никогда в жизни. Но библиотекари еще и принялись кричать, не в силах сдержать эмоции:

– Сравните слова «он» и «она»!

– Давайте попробуем «глобальное потепление»!

– «Пираты» против «ниндзя»!

Комната буквально взорвалась от восторга, любопытства и ликования.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Жан-Батист Мишель читать все книги автора по порядку

Жан-Батист Мишель - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры отзывы


Отзывы читателей о книге Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры, автор: Жан-Батист Мишель. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x