Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1)
- Название:Методы статистического анализа исторических текстов (часть 1)
- Автор:
- Жанр:
- Издательство:Наука
- Год:1999
- Город:Москва
- ISBN:5-02-013542-9
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) краткое содержание
Книга посвящена новому направлению в современной прикладной статистике. Предлагаются эмпирико-статистические методы распознавания зависимых и независимых текстов, в том числе исторических, т. е. текстов повествовательного характера, например хроник, летописей Эти методы позволяют во многих случаях датировать древние тексты, описанные в них события и могут применяться для анализа текстов самой разной природы, в теории распознавания образов, при анализе генетических кодов, для уточнения дат древней хронологии. Представлен богатый научный материал — результаты статистической обработки хроник, древних астрономических сообщений, летописей. Книга стала уникальным явлением в мировой научной литературе по прикладной статистике.
Для специалистов в области математической статистики и распознавания образов, лингвистики, филологии, хронологии, истории, а также широкого круга читателей.
Методы статистического анализа исторических текстов (часть 1) - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
Для пунктов 1-10, за исключением пункта 3 (то есть длительности правления), будем использовать баллы 0,+1,-1.
Для пунктов 11–21 будем использовать баллы 0, +1/2, -1/2.
Для пунктов 22–33 — баллы 0, +1/3, -1/3.
При сравнении пунктов анкет-кодов возможны три случая. Проиллюстрируем их на примере пунктов с номером 5, то есть АК-5: «обстоятельства смерти правителя».
а) Сравниваемые сведения СОВПАДАЮТ. Например, и в АК, и в АК' сказано, что оба сравниваемых царя умерли естественной смертью. В этом случае этой паре пунктов мы придадим балл +1 (совпадение). Будем условно записывать это так: Е 5=+1.
б) Сравниваемые сведения ЯВНО НЕ СОВПАДАЮТ, противоречат друг другу. Например, в АК сказано, что царь умер естественной смертью, а в АК' сообщено, что сравниваемый с ним царь убит в результате заговора. В этой ситуации мы дадим балл -1 (противоречие). Запишем: Е 5=-1.
в) Сравниваемые сведения НЕЙТРАЛЬНЫ, то есть не совпадают, но и не противоречат друг другу. Например, в АК сказано, что «царь умер», а в АК' сообщено, что «царь был убит». Здесь дадим балл 0 (нейтральная ситуация), то есть напишем: Е 5=0.
Итак, для каждой пары пунктов с номером i (сравниваемых анкет-кодов) мы получаем некоторое число E i. Следовательно, для пары анкет-кодов АК и АК' двух сравниваемых царей можно подсчитать сумму всех получившихся чисел E i:
f(AK,AK') = Е 1+ E 2+ E 4+ E 5+… + E 33.
Напомним, что коэффициент E 3мы здесь не рассматриваем, поскольку для сравнения длительностей правлений у нас разработана другая методика, изложенная выше.
Эксперименты с конкретными историческими анкет-кодами показали, что во многих случаях значение коэффициента E iприходится полагать равным нулю, так как довольно часто сравниваемые сведения о двух царях и не совпадают, и не противоречат друг другу. Тем самым возрастает роль +1 и -1, когда они появляются. Далее, оказалось, что в подавляющем большинстве случаев приходится полагать E 34= 0. Дело в том, что обычно при сравнении «остатков биографий» двух царей обнаруживается, что сравниваемые второстепенные, не очень важные сведения настолько разнохарактерны, что их вообще трудно сопоставить. Например, про одного царя в «остатке биографии» АК-34 говорится, что он любил искусство и даже пел, а про другого царя сказано, что он у него были черные волосы. Эти сведения можно, конечно, принять к сведению, но сравнивать их бессмысленно. В таких случаях естественно приходилось полагать балл Е 34равным нулю.
Пусть теперь нам даны две летописные династии a и b, каждая из которых состоит из k последовательных царей. «Заполняя на каждого из них анкету», то есть составляя на каждого царя его анкет-код, мы получаем последовательность, поток анкет-кодов
АК 1, АК 2, АК 3…, АК kдля династии a, и другую последовательность, поток анкет-кодов
АК' 1, АК' 2, АК' 3…, АК' kдля династии b.
Последовательность анкет-кодов царей
(АК 1, АК 2, АК 3…, АК k)
естественно назвать ПОТОКОМ АНКЕТ-КОДОВ ДИНАСТИИ a. Обозначим его через AK(a). Аналогично, последовательность «анкет царей»
(АК' 1, АК' 2, АК' 3…, АК' k)
назовем ПОТОКОМ АНКЕТ-КОДОВ ДИНАСТИИ b и обозначим его через AK(b). Другими словами, поток анкет-код династии — это просто последовательность анкет-кодов составляющих ее царей, фактических правителей.
Теперь мы хотим сравнить между собой потоки анкет-кодов AK(a) и AK(b) двух династий a и b. Для каждой пары сравниваемых анкет-кодов царей мы вычисляем коэффициент f(AK i,AK' i). Наконец, можно определить число
f(AK 1,AK' 1) + f(AK 2,AK' 2) +… + f(AK k,AK' k) e(a,b) = —,
k
то есть попросту среднее арифметическое всех коэффициентов f(AK i,AK' i). Другими словами, шаг за шагом, мы сравниваем каждую пару последовательных царей двух сопоставляемых династий, подсчитываем для каждой такой пары «меру близости» f(AK i,AK' i), после чего берем среднее арифметическое по всем царям династии.
Таким образом, близость или удаленность друг от друга потоков анкет-кодов двух династий a и b можно оценивать парой чисел
(c(a,b), e(a,b)),
где коэффициент c(a,b)=ВССД описан выше.
Мы опускаем здесь описание численных экспериментов со сравнением потоков анкет-кодов летописных династий. Сообщим только результат: оказалось, что описанная выше методика позволяет довольно уверенно отделять «зависимые анкет-коды» от «независимых». Детали см. в [416], [438], [375]. Экспериментальная проверка подтвердила верность принципа малых искажений и в этом случае: оказалось, что потоки анкет-кодов, изображающие одну и ту же династию, отличаются друг от друга существенно меньше, чем потоки анкет-кодов разных реальных династий. Ясно, что это позволяет датировать потоки анкет-кодов династий, следуя схеме, описанной выше.
Ниже мы приведем конкретные примеры зависимых потоков анкет-кодов некоторых пар династий-дубликатов. Этот сравнительный материал очень полезен, так как показывает — насколько иногда ярко проявляется то обстоятельство, что перед нами два дубликата, попросту два разных летописных описания одной и той же реальной династии.
В заключении остановимся на одном важном обстоятельстве. Изложенная выше методика сравнения анкет-кодов является не просто «данью статистической моде», а чрезвычайно полезным орудием исследования. Важно, что методика нацелена на сравнение не просто какой-то пары отдельных летописных биографий, а на сравнение ДВУХ ДЛИННЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ТАКИХ БИОГРАФИЙ. Например, мы будем сравнивать двадцать последовательных биографий царей из одной династии с двадцатью последовательными биографиями царей из другой династии. Такие примеры см. ниже. Вывод о зависимости двух династий можно делать только на основе сравнения двух «длинных потоков биографий».
Напротив, близость, «похожесть» двух ОТДЕЛЬНЫХ ИЗОЛИРОВАННЫХ биографий каких-то персонажей ни о каком хронологическом дублировании может не говорить. Ведь не составляет особого труда подобрать пару «похожих биографий» двух разных исторических деятелей из современной нам эпохи, выдергивая из их жизни близкие, иногда поразительно похожие факты. Причем, таких «похожих фактов» можно иногда набрать довольно много. В то же время совершенно ясно, что делать отсюда какие-то «хронологические выводы» не следует. Все эти совпадения могут оказаться просто игрой случая. Но совсем другое дело, когда мы обнаруживаем две близкие ДЛИННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ, два ДЛИННЫХ «ПОТОКА» удивительно похожих биографий. Когда формальная статистическая методика «вылавливает» в огромном наборе древних документов пару «ПОХОЖИХ ДЛИННЫХ ПОТОКОВ БИОГРАФИЙ», — причем «похожесть» эта устанавливается не «на глазок», а формальным образом, становится ясно, что мы обнаружили нечто весьма серьезное. Тем более, что наши методы позволяют (хотя и грубо) оценивать вероятность того, насколько такая «близость» случайна. Если оказывается, что вероятность случайного совпадения мала, это усиливает подозрения, что мы действительно натолкнулись на «размножение» одной и той же реальной династии в разных летописях.
Читать дальшеИнтервал:
Закладка: