Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1)
- Название:Методы статистического анализа исторических текстов (часть 1)
- Автор:
- Жанр:
- Издательство:Наука
- Год:1999
- Город:Москва
- ISBN:5-02-013542-9
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) краткое содержание
Книга посвящена новому направлению в современной прикладной статистике. Предлагаются эмпирико-статистические методы распознавания зависимых и независимых текстов, в том числе исторических, т. е. текстов повествовательного характера, например хроник, летописей Эти методы позволяют во многих случаях датировать древние тексты, описанные в них события и могут применяться для анализа текстов самой разной природы, в теории распознавания образов, при анализе генетических кодов, для уточнения дат древней хронологии. Представлен богатый научный материал — результаты статистической обработки хроник, древних астрономических сообщений, летописей. Книга стала уникальным явлением в мировой научной литературе по прикладной статистике.
Для специалистов в области математической статистики и распознавания образов, лингвистики, филологии, хронологии, истории, а также широкого круга читателей.
Методы статистического анализа исторических текстов (часть 1) - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
в) Абсолютно то же самое мы видим, сравнивая параметр α для русский летописей группы якобы 1110–1210 годов и летописей 1500–1600 годов. И здесь значения α оказываются достаточно близкими. Вновь мы видим тот же хронологический сдвиг примерно на 400 лет.
ВЫВОД. Сравнение значений параметра α позволяет высказать гипотезу, что наш статистический эксперимент с большой группой русских летописей обнаружил хронологический сдвиг на 300–400 лет внутри русской истории. По-видимому, некоторые русские летописи были неправильно датированы. Следовательно, были неправильно датированы и описываемые в них события. В результате некоторые реальные события XIV–XVI веков н. э. «уехали во времени вниз» на 300–400 лет и породили свои «фантомные отражения» в эпохе якобы IX–XIII веков н. э. Далее мы увидим, что этот 300-400-летний сдвиг в русской истории обнаруживается и другими, совершенно независимыми методами.
1.6.17. Выводы
1) Сформулирована новая эмпирико-статистическая модель, позволяющая статистически распознавать ЗАВИСИМЫЕ и НЕЗАВИСИМЫЕ летописи. Сформулированы статистические принципы УВАЖЕНИЯ К ИНФОРМАЦИИ и АМПЛИТУДНОЙ КОРРЕЛЯЦИИ для бедных зон летописей.
2) Наша модель и оба принципа, то есть статистические гипотезы, проверены численным экспериментом на материале русских летописей. На достоверном и надежно датированном материале модель и оба принципа подтвердились.
3) Это позволяет предложить методику распознавания зависимых и независимых летописей.
4) При анализе русских летописей получены такие статистические выводы.
а) Затухающий график 1-F(x), где F(x) — нормированная накопленная сумма функции объема летописи, можно достаточно хорошо аппроксимировать функцией exp(-(λ) x α) при подходящем выборе параметров α и λ.
б) Для ЗАВИСИМЫХ летописей X и Y соответствующие им точки (α X,λ X) и (α Y,λ Y) на плоскости (α,λ) близки друг к другу.
в) Для НЕЗАВИСИМЫХ летописей X и Y соответствующие им точки (α X,λ X) и (α Y,λ Y) на плоскости (α,λ), напротив, далеки друг от друга.
г) Параметр α, а иногда и параметр λ, обычно характеризует всю группу летописей, описывающих события данного периода. Другими словами, параметр α в определенном смысле является «инвариантом исторической эпохи», ее летописей. Этот эффект можно считать установленным для русских летописей XIV–XVII веков, то есть для более или менее достоверно датированных текстов.
1.7. Принцип корреляции максимумов на материале источников о смутном времени в истории России 1584–1619 годов
(Н.С. Келлин, Л.Е. Морозова, А.Т. Фоменко)
Здесь мы покажем — как принцип корреляции максимумов проявляется на группе зависимых исторических текстов, относящихся к эпохе смутного времени на Руси конца XVI — начала XVII веков н. э. Мы взяли 20 текстов, каждый из них разбили на погодные фрагменты, то есть на куски, описывающие события отдельных лет. Затем Н.С. Келлин и Л.Е. Морозова подсчитали объемы всех этих «глав». А именно, было подсчитано количество слов в каждой «главе». Полученные результаты были систематизированы в виде единой таблицы, где для каждого из 20 текстов был указан объем его погодных фрагментов от 1584 до 1619 годов.
Вот список исследованных текстов:
1) Повесть о честном житии, 2) Повесть како восхити, 3) Повесть како отмсти, 4) Житие Дмитрия (Тулупова), 5) Житие Дмитрия (Малютина), 6) Сказание о Гришке, 7) Сказание о Федоре, 8) Сказание о самозванце, 9) Повесть Шаховского, 10) Житие Иова, 11) Сказание Авраамия (1-я редакция), 12) Сказание Авраамия (2-я редакция), 13) Хронограф 1617 года, 14) Временник Тимофеева, 15) Повесть Катырева (1-я редакция), 16) Повесть Катырева (2-я редакция), 17) Иное сказание, 18) Пискаревский летописец, 19) Новый летописец.
Позднее были добавлены еще три текста: 20) Извет Варлаама, 21) Бельский летописец и 22) Сказание о Скопине.
Приведем таблицу объемов погодных фрагментов для первых 19 текстов. По горизонтальной оси отложены годы, по вертикальной номера текстов. Годы указаны сокращенно: вместо 1584, 1585, 1586 и т. д. написано 84, 85, 86 и так далее.
ТАБЛИЦА 2
84 85 86 87 88 89 90 91 92 93 94 95 96 97 98
1: 432-288-200-375-376-1112-1632-2784
2: 140-455-458-105-196
3: 230-800-157-380
4: 120-740-48
5: 180-500-400-300-306-500-400
6: 152-52-180-76-68
7: 240-200-206-240-200-208-210-2884-20-22-26-756
8: 20-93-128
9: 128-600-20-26-28-360
10: 240-200-100-102-106-450-60-56-52-51-50-50-52
11: 44-42-108-306
12: 54-42-347-112
13: 312-172-43-42-132-324
14: 900-120-4420-26-22-20-20-26-28-3000
15: 150-120-300-500
16: 152-86-300-10-10-12-434
17: 264-675-863-92-90-90-92-94-1034
18: 325-75-50-44-32-46-122-430-86-35-140-20-20-110-1160
19: 441-99-150-152-54-54-189-1548-522-36-342-648-50-50-540
Все эти исторические тексты описываются, в основном, одни и те же события, следовательно, они зависимы, опираются на один и тот же фонд уцелевших сведений. Таблица 2 показывает, что имеется ярко выраженная корреляция между точками всплесков, то есть локальных максимумов функций объемов этих текстов. Почти все графики делают всплески практически одновременно, в частности, в годы 1584, 1587, 1591, 1598.
Приведем теперь результат второго численного эксперимента, в котором к предыдущим 19 текстам были добавлены еще три текста (см. выше), а также были расширены временные рамки — к интервалу 1584–1598 гг. н. э. были присоединены годы от 1598 до 1606. Была построена таблица, аналогичная предыдущей. Сейчас мы приведем таблицу, в которой символом Х отмечены положения локальных максимумов для всех 22 исторических текстов на интервале от 1584 года до 1606 года н. э.
ТАБЛИЦА 3
84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04 05 06
1: Х-Х-Х
2: Х-Х-Х-Х-Х-Х
3: Х-Х-Х-Х-Х-Х
4: Х-Х-Х-Х-Х
5: Х-Х-Х-Х-Х
6: Х-Х-Х-Х-Х
7: Х-Х-Х-Х-Х-Х
8: Х-Х-Х-Х-Х
9: Х-Х-Х-Х
10:Х-Х-Х-Х-Х-Х
11:Х-Х-Х-Х-Х-Х
12:Х-Х-Х-Х-Х-Х-Х
13:Х-Х-Х-Х
14:Х-Х-Х-Х-Х
15:Х-Х-Х-Х-Х-Х
16:Х-Х-Х-Х-Х-Х
17:Х-Х-Х-Х-Х
18:Х-Х-Х-Х-Х-Х-Х
19:Х-Х-Х-Х-Х-Х-Х-Х
20:Х-Х-Х-Х-Х-Х
21:Х-Х-Х-Х-Х-Х-Х-Х
22:Х-Х-Х-Х
Отчетливо видно, что все функции объема делают всплески практически одновременно, что объясняется зависимостью этих текстов. Следовательно, принцип корреляции точек всплесков функций объемов зависимых текстов здесь подтверждается.
Эту зависимость текстов можно выразить численно. Введем следующее «расстояние» между функциями объема vol X(t) и vol Y(t) для двух текстов X и Y, каждый из которых разбит в объединение отдельных погодных фрагментов X(t) и Y(t) соответственно. Напомним, что фрагменты X(t) и Y(t) описывают события лишь одного года t.
Пусть параметр t изменяется на отрезке времени от года A до года B. Обозначим через t(X,1), t(X,2)…, t(X,N) — те годы, где функция график объемов vol X(t) делает всплески (то есть достигает локальных максимумов). Соответственно, через t(Y,1), t(Y,2)…, t(Y,M) обозначим точки всплесков графика объемов vol Y(t).
Для каждой точки t(X,i) найдем БЛИЖАЙШУЮ К НЕЙ ТОЧКУ из последовательности t(Y,1), t(Y,2)…, t(Y,M). Пусть это будет некоторая точка t(Y,k). Обозначим через p(i) — расстояние между ними, измеренное в годах, то есть — абсолютную величину разности t(X,i)-t(Y,k). Другими словами, выясняем — какой локальный максимум Y ближе всего расположен к выбранному локальному максимуму X.
Читать дальшеИнтервал:
Закладка: