Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1)

Тут можно читать онлайн Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) - бесплатно полную версию книги (целиком) без сокращений. Жанр: История, издательство Наука, год 1999. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Методы статистического анализа исторических текстов (часть 1)
  • Автор:
  • Жанр:
  • Издательство:
    Наука
  • Год:
    1999
  • Город:
    Москва
  • ISBN:
    5-02-013542-9
  • Рейтинг:
    3.82/5. Голосов: 111
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 80
    • 1
    • 2
    • 3
    • 4
    • 5

Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) краткое содержание

Методы статистического анализа исторических текстов (часть 1) - описание и краткое содержание, автор Анатолий Фоменко, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru

Книга посвящена новому направлению в современной прикладной статистике. Предлагаются эмпирико-статистические методы распознавания зависимых и независимых текстов, в том числе исторических, т. е. текстов повествовательного характера, например хроник, летописей Эти методы позволяют во многих случаях датировать древние тексты, описанные в них события и могут применяться для анализа текстов самой разной природы, в теории распознавания образов, при анализе генетических кодов, для уточнения дат древней хронологии. Представлен богатый научный материал — результаты статистической обработки хроник, древних астрономических сообщений, летописей. Книга стала уникальным явлением в мировой научной литературе по прикладной статистике.

Для специалистов в области математической статистики и распознавания образов, лингвистики, филологии, хронологии, истории, а также широкого круга читателей.

Методы статистического анализа исторических текстов (часть 1) - читать онлайн бесплатно полную версию (весь текст целиком)

Методы статистического анализа исторических текстов (часть 1) - читать книгу онлайн бесплатно, автор Анатолий Фоменко
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Конечно, если некоторые из описанных событий уже известны нам по другим летописям, это позволяет «привязать» их к современной шкале отсчета времени. Но если такое отождествление не удается, то задача датировки усложняется. При этом может оказаться, что описываемые в летописи события нам уже фактически известны. Однако их описание пока по внешности неузнаваемо, поскольку летопись написана на другом языке, летописец употребляет совсем другие имена, прозвища, географические названия и т. п. Поэтому полезно располагать методикой эмпирико-статистического характера, которая иногда позволяет датировать события на основании формальных количественных характеристик исследуемого текста.

Предположим, что исторический текст X разбивается на куски (фрагменты) X(t), каждый из которых описывает сравнительно малый по длине промежуток времени, например год (или десятилетие) с номером t. Примеры таких текстов многочисленны. Таковы погодные летописи, — то есть описывающие события год за годом, «по годам», — дневники, многие исторические произведения, учебники и монографии по истории. Куски, фрагменты X(t) мы будем условно называть «главами». Они естественно выстраиваются в хронологическую последовательность, согласно внутренней относительной хронологии данной летописи. Во многих исторических текстах подобное «разбиение на главы», — каждая из которых описывает свой отдельный год, — присутствует в явном виде. Таковы, например, многие русские летописи [165], [166], в том числе знаменитая Радзивиловская летопись (Повесть временных лет) [486]. Такова, например, известная римская книга Liber Pontificalis, изд. Т. Моммзена «Gestorum Pontificum Romanorum» (1898).

Разнообразные характеристики объема информации, сообщаемой летописью X о годе с номером t, могут быть измерены, например, так.

1) vol X(t) = количество страниц в «главе» X(t). Это число назовем объемом «главы» X(t). Объем может равнять нулю, если год t вообще не описан в летописи X, то есть пропущен. Вместо количества страниц можно подсчитывать число строк, число знаков и т. п. Это не влияет на идею и на применение методики.

2) Количество упоминаний года t во всей летописи X.

3) Количество имен всех исторических персонажей, упомянутых в «главе» X(t).

4) Количество упоминаний какого-то конкретного имени (персонажа) в «главе» X(t).

5) Количество ссылок в «главе» X(t) на некоторый другой текст.

Запас подобных количественных характеристик достаточно велик и весьма важен. Каждая характеристика, как мы видим, приписывает каждому году t, описанному в летописи, определенное число. Разным годам будут отвечать, вообще говоря, разные числа. Поэтому объемы «глав» X(t) будут, вообще говоря, меняться с изменением номера (года) t. Последовательность объемов X(A)….,X(B) мы назовем функцией объема данного погодного текста X.

1.2. Принцип корреляции максимумов

Итак, пусть некоторый исторический период от года А до года B в истории одного государства Г описан в каком-то достаточно обширной погодной летописи Х. То есть, летопись X уже разбита (или может быть разбита) на куски — «главы» Х(t), каждый из которых описывает один свой год t. Подсчитаем объем каждого такого куска, например, число слов или число знаков, страниц и т. п. Затем изобразим полученные числа в виде графика, отложив по горизонтали годы t, а по вертикали — объемы «глав», то есть vol X(t). См. рис. 3.1. В результате мы изобразили функцию объема летописи X в виде графика.

Для другой погодной летописи Y, то есть тоже описывающей «поток событий» этой же эпохи (А,В) по годам, ее соответствующий график функции объема будет иметь, вообще говоря, другой вид. См. рис. 3.1. Дело в том, что большую роль в распределении объема играют личные интересы летописцев X и Y. Например, хроника по истории искусств и военная летопись существенно по-разному расставляют акценты и по-разному распределяют объем информации по годам. Или, например, летописец X «проигравшей стороны» описывает поражение своей армии в войне весьма скупо и сдержанно (в нескольких строчках), а летописец Y «победившей стороны» рассказывает об этом же сражении очень подробно, восторженно и многословно, на нескольких страницах.

Насколько существенны эти различия? То есть, существуют ли такие характеристики графиков объема, которые определяются только интервалом времени (А,В), историей государства Г и которые однозначно характеризуют все, или почти все летописи, описывающие этот временнóй интервал и данное государство?

Оказывается, важной характеристикой графика объема vol X(t) являются годы t, в которые график делает ВСПЛЕСК, то есть достигает своих ЛОКАЛЬНЫХ МАКСИМУМОВ. То обстоятельство, что в некоторой точке t график делает всплеск, означает, что этот год описан в летописи БОЛЕЕ ПОДРОБНО, например, бóльшим количеством страниц, чем соседние годы. Следовательно, всплески графика, то есть локальные максимумы указывают нам годы, подробно описанные летописцем на отрезке времени (А,В). B разных летописях X и Y «подробно описанными» могут оказаться, вообще говоря, разные годы.

Чем объясняется такая неравномерность в описании разных годов? Одно из объяснений таково. Летописец более подробно описал данный «древний год», поскольку от этого «древнего года» до него дошло больше уцелевшей информации, например, бóльший объем старых документов, чем от соседних лет.

Схема дальнейших наших рассуждений такова.

1) Мы сформулируем теоретическую модель, то есть статистическую гипотезу, позволяющую предсказывать — какие именно годы из интервала времени (A,B) будут подробно описаны поздним летописцем, уже не являющимся современником описываемых им древних событий.

2) Затем мы математически формализуем эту статистическую модель (гипотезу).

3) Проверим ее справедливость на достаточно большом достоверном историческом материале.

4) Обнаружив, что теоретическая модель подтверждается в эксперименте, мы предложим методику датирования древних событий.

Пусть С(t) — объем всех текстов, написанных о годе t современниками этого года. См. рис. 3.2. Как и выше, построим числовой график объема на интервале времени (A,B). Конечно, точный вид этого графика С(t) сегодня нам НЕИЗВЕСТЕН, так как с течением времени первичные тексты, написанные современниками событий года t, постепенно утрачиваются. До наших дней дошла только какая-то их часть. График C(t) можно назвать ГРАФИКОМ ПЕРВИЧНОГО ФОНДА ИНФОРМАЦИИ. Пусть из эпохи (A,B) современники наиболее подробно описали некоторые годы, то есть зафиксировали об этих годах особенно много информации. Причины такой «первичной неравномерности» мы здесь обсуждать не будем, так как они для нас сейчас не важны. На языке графика объема C(t) такие «подробно описанные современниками» годы будут выявляться тем, что именно в эти годы график делает всплески.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Анатолий Фоменко читать все книги автора по порядку

Анатолий Фоменко - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Методы статистического анализа исторических текстов (часть 1) отзывы


Отзывы читателей о книге Методы статистического анализа исторических текстов (часть 1), автор: Анатолий Фоменко. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x