Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1)

Тут можно читать онлайн Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) - бесплатно полную версию книги (целиком) без сокращений. Жанр: История, издательство Наука, год 1999. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Методы статистического анализа исторических текстов (часть 1)
  • Автор:
  • Жанр:
  • Издательство:
    Наука
  • Год:
    1999
  • Город:
    Москва
  • ISBN:
    5-02-013542-9
  • Рейтинг:
    3.82/5. Голосов: 111
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 80
    • 1
    • 2
    • 3
    • 4
    • 5

Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) краткое содержание

Методы статистического анализа исторических текстов (часть 1) - описание и краткое содержание, автор Анатолий Фоменко, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru

Книга посвящена новому направлению в современной прикладной статистике. Предлагаются эмпирико-статистические методы распознавания зависимых и независимых текстов, в том числе исторических, т. е. текстов повествовательного характера, например хроник, летописей Эти методы позволяют во многих случаях датировать древние тексты, описанные в них события и могут применяться для анализа текстов самой разной природы, в теории распознавания образов, при анализе генетических кодов, для уточнения дат древней хронологии. Представлен богатый научный материал — результаты статистической обработки хроник, древних астрономических сообщений, летописей. Книга стала уникальным явлением в мировой научной литературе по прикладной статистике.

Для специалистов в области математической статистики и распознавания образов, лингвистики, филологии, хронологии, истории, а также широкого круга читателей.

Методы статистического анализа исторических текстов (часть 1) - читать онлайн бесплатно полную версию (весь текст целиком)

Методы статистического анализа исторических текстов (часть 1) - читать книгу онлайн бесплатно, автор Анатолий Фоменко
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Теперь в качестве «летописи» X' возьмем снова книгу В.С. Сергеева, а в качестве «летописи» Y' — ее же, но заменив порядок лет в тексте на противоположный. То есть, грубо говоря, прочитав книгу Сергеева «задом наперед». Оказывается, в этом случае p(X',Y') будет равняться 1/3. Таким образом, получается значение, существенно более близкое к единице, чем предыдущее, и указывающее на независимость сравниваемых текстов. Что и неудивительно, так как проведенная нами операция «перевертывания летописи» очевидно дает два заведомо независимых текста.

Пример 2.

Возьмем следующие заведомо зависимые исторические тексты, две русские летописи:

X — Никифоровская летопись,

Y — Супрасльская летопись [166].

Следующий интервал времени описан в обоих летописях: якобы, 850-1256 годы н. э.

См. графики их объемов на рис. 3.12. Оба графика объемов «глав» на интервале якобы 850-1255 годы н. э. имеют 31 всплеск и делают эти всплески практически одновременно, в одни и те же годы. Подсчет дает, что здесь p(X,Y) = 10 -24. Это значение весьма мало, что подтверждает зависимость этих текстов. В Приложение 4.1 мы приводим точные численные значения функций объемов этих летописей.

Пример 3.

Рассмотрим следующие две русские летописи:

X — Холмогорская летопись [166],

Y — «Повесть временных лет».

Следующий интервал времени описан в обоих летописях: якобы, 850-1000 годы н. э. Графики объемов летописей также достигают локальных максимумов ПРАКТИЧЕСКИ ОДНОВРЕМЕННО. И снова это не случайно, а закономерно, иначе реализовался бы единственный шанс из 10 15шансов. Здесь p(X,Y)=10 -15. На указанном временнóм интервале эти две летописи зависимы. На рис. 3.13 представлены сразу три графика объемов для Супрасльской летописи, Никифоровской летописи и Повести временных лет. Последняя летопись «богаче», поэтому ее график имеет больше локальных максимумов и зависимость не столь очевидна. Тем не менее, после сглаживания выясняется, что между этими тремя графиками также имеется ярко выраженная зависимость. Подробнее о сравнении «богатых» и «бедных» летописей мы расскажем в следующих разделах. Распределение объемов указанных летописей приведено в Приложении 4.1.

Пример 4.

Приведем пример из средневековой римской истории.

X — фундаментальная монография немецкого историка Фердинанда Грегоровиуса «История города Рима в средние века», тома 1–5. См. [47]. Эта книга написана в XIX веке на основе огромного числа средневековых светских и церковных документов.

Y — Liber Pontificalis (T. Mommsen, Gestorum Pontificum Romanorum, 1898). Это «Книга Понтифексов» (то есть список и жизнеописания римских пап средних веков), восстановленная немецким историком Теодором Моммзеном на основе средневековых римских текстов. Здесь, оказывается, p(X,Y)=10 -10, что указывает на яркую зависимость этих двух текстов. В предположении случайности такой близости, реализовался бы один шанс из 10 миллиардов.

И так далее. Во всех нескольких десятках обработанных нами примерах исторических текстов, — как ЗАВЕДОМО ЗАВИСИМЫХ, так и ЗАВЕДОМО НЕЗАВИСИМЫХ, — наша теоретическая модель подтвердилась. Таким образом, удалось обнаружить закономерности, позволяющие статистически характеризовать ЗАВИСИМЫЕ исторические тексты, то есть описывающие один и тот же период времени, одни и те же «потоки событий» в истории одного и того же региона, государства. В то же время, как показали эксперименты, если два исторических текста X и Y, напротив, НЕЗАВИСИМЫ, то есть описывают заведомо разные исторические эпохи, или разные регионы, или существенно разные «потоки событий», то графики объемов vol X(t) и vol Y(t) делают всплески в существенно разные годы. То есть, никакой корреляции не наблюдается. В этом последнем случае типичное значение для коэффициента p(X,Y), при количестве локальных максимумов от 10 до 15, колеблется от 1 до 1/100. Приведем типичный пример.

Пример 5.

Вновь обратимся к «античной» истории Рима. В качестве сравниваемых текстов X и Y мы взяли следующие два фрагмента из книги В.С. Сергеева «Очерки по истории Древнего Рима» [188]. Первый фрагмент описывает период якобы 520–380 годы до н. э., а второй фрагмент — якобы 380–240 годы до н. э. Считается, что эти периоды независимы. Подсчет коэффициента p(X,Y) дает, что здесь он равен 1/5. Это значение разительно, на несколько порядков, отличается от типичных значений 10 -12— 10 -6для заведомо зависимых текстов, с аналогичным количеством локальных максимумов. Таким образом, эти два текста, «две половины» книги В.С. Сергеева оказываются действительно НЕЗАВИСИМЫМИ.

Выше мы использовали такую числовую характеристику «главы», как ее объем. Однако, как показали наши исследования, аналогичные статистические закономерности (для достаточно больших исторических текстов) обнаруживаются и при использовании других числовых характеристик. Например, можно рассматривать количество имен в каждой «главе», количество ссылок на другие летописи и т. п.

В нашем вычислительном эксперименте сравнивались:

а) древние тексты с древними,

б) древние с современными,

в) современные с современными.

Как мы уже сказали, наряду с графиками объема «глав» исследовались и другие количественные характеристики текстов. Например, графики числа упомянутых имен, графики числа упоминаний данного года в тексте, графики частот ссылок на какой-либо другой фиксированный текст, и т. п. [416], [438], [419], [375].

Оказалось, что для всех этих характеристик выполняется тот же ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ. А именно, графики зависимых текстов делают всплески практически одновременно, а для независимых текстов точки всплесков графиков никак не коррелируют.

Сформулируем еще одно следствие из нашей основной модели, статистической гипотезы.

А именно, если два исторических текста ЗАВЕДОМО ЗАВИСИМЫ, то есть описывают один и тот же «поток событий» на одном и том же интервале времени в истории одного и того же государства, то для любой пары указанных выше числовых характеристик соответствующие им графики делают всплески приблизительно в одни и те же годы. Другими словами, если какой-то год в обоих летописях описан подробнее, чем соседние годы, то увеличится (локально) число упоминаний этого года в обоих летописях, увеличится количество имен персонажей, упомянутых в этом году в обоих летописях и т. п. Напротив, если тексты ЗАВЕДОМО НЕЗАВИСИМЫ, то никакой корреляции между указанными числовыми характеристиками быть не должно.

Проверка этого «вторичного принципа корреляции максимумов» подтвердила его справедливость на конкретных заведомо зависимых исторических текстах. См. [375], с. 110–111.

1.5. Методика датирования исторических событий

Поскольку наша теоретическая модель подтвердилась на экспериментальном материале, мы можем теперь предложить новую методику датирования древних событий. Хотя она, конечно, не универсальна. Опишем идею метода.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Анатолий Фоменко читать все книги автора по порядку

Анатолий Фоменко - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Методы статистического анализа исторических текстов (часть 1) отзывы


Отзывы читателей о книге Методы статистического анализа исторических текстов (часть 1), автор: Анатолий Фоменко. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x