Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1)
- Название:Методы статистического анализа исторических текстов (часть 1)
- Автор:
- Жанр:
- Издательство:Наука
- Год:1999
- Город:Москва
- ISBN:5-02-013542-9
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) краткое содержание
Книга посвящена новому направлению в современной прикладной статистике. Предлагаются эмпирико-статистические методы распознавания зависимых и независимых текстов, в том числе исторических, т. е. текстов повествовательного характера, например хроник, летописей Эти методы позволяют во многих случаях датировать древние тексты, описанные в них события и могут применяться для анализа текстов самой разной природы, в теории распознавания образов, при анализе генетических кодов, для уточнения дат древней хронологии. Представлен богатый научный материал — результаты статистической обработки хроник, древних астрономических сообщений, летописей. Книга стала уникальным явлением в мировой научной литературе по прикладной статистике.
Для специалистов в области математической статистики и распознавания образов, лингвистики, филологии, хронологии, истории, а также широкого круга читателей.
Методы статистического анализа исторических текстов (часть 1) - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
6) Имеется еще одна причина нарушения четкой формальной картины. Она заключается в том, что иногда трудно с определенностью установить время начала правления царя. Например, считать ли его от момента фактического прихода к власти, или от момента формальной интронизации. Для начала правления Фридриха II, например, в разных таблицах приводятся различные варианты: 1196, 1212, 1215, 1220 годы н. э. В то же время, с концом правления обычно никаких трудностей нет. Чаще всего, это смерть царя. Таким образом, мы приходим к необходимости «раздвоения» царя, или даже к рассмотрению его в трех вариантах. Бóльшее число вариантов на практике, к счастью, появлялось исключительно редко. Все эти варианты включались в общий династический поток. При этом требовалось, чтобы ни одна из выделяемых в дальнейшем для исследования династических струй не содержала двух различных вариантов одного и того же правления царя.
7) Для всех государств из указанных выше географических регионов был составлен (на основе собранных нами хронологических данных в скалигеровской версии) полный список D всех летописных династий длины 15. То есть, был составлен список всех династий из 15 последовательных царей. Каждый царь может при этом попасть в несколько 15-членных династий, то есть династии могут «перекрываться». Перечислим основные династические потоки, подвергнутые статистическому анализу. Это: епископы и папы в Риме, патриархи Византии, сарацины, первосвященники в Иудее, грекобактрийцы, экзархи в Равенне, фараонские династии Египта, средневековые династии Египта, династии Византии, Римской империи, Испании, России, Франции, Италии, Османской = Оттоманской империи, Шотландии, Лакедемона, Германии, Швеции, Дании, Израиля, Иудеи, Вавилона, Сирии, Португалии, Парфии, Боспорского царства, Македонии, Польши, Англии.
8) После применения к списку D возмущений типов (1) и (2) (см. выше) оказалось, что получается примерно 15×10 11виртуальных династий. То есть, в множестве vir(D) оказывается 15×10 11точек.
2.4. Результат эксперимента: коэффициент c(a,b) хорошо различает зависимые и независимые династии царей
Вычислительный эксперимент, проведенный в 1977–1979 годах мною совместно с М. Замалетдиновым и П. Пучковым, подтвердил принцип малых искажений. А именно, оказалось, что для заведомо зависимых летописных династий a и b число ВССД = c(a,b) всегда не превышает 10 -8и обычно колеблется от 10 -12до 10 -10. При вероятностной интерпретации это означает, что если рассматривать наблюдаемую близость двух зависимых летописных династий как случайное событие, то его вероятность мала, событий исключительно редкое, поскольку реализуется единственный из ста миллиардов шансов.
Выяснилось далее, что если две летописные династии a и b изображают две заведомо разные реальные династии, то коэффициент ВССД = c(a,b) «существенно больше». А именно, он всегда не меньше чем 10 -3, то есть «велик». Как и в случае с коэффициентом p(X,Y) здесь важны, конечно, не абсолютные значения ВССД = c(a,b), а разница в несколько порядков между «зависимой зоной» и «независимой зоной». См. рис. 3.36.
Итак, при помощи коэффициента ВССД удалось обнаружить существенное различие между заведомо зависимыми и заведомо независимыми летописными династиями.
2.5. Методика датирования царских династий и методика обнаружения фантомных династических дубликатов
Итак, при помощи коэффициента с(a,b) можно уверенно различать зависимые и независимые пары летописных династий. Важный экспериментальный факт состоит в том, что летописцы ошибаются «не слишком сильно». Во всяком случае, их ошибки существенно меньше величины, различающей независимые династии.
Это позволяет, в рамках проведенного эксперимента, предложить новую методику распознавания зависимых летописных династий и методику датировки неизвестных династий. Поступая по аналогии с предыдущим пунктом, вычисляем для неизвестной династии d коэффициент с(a,d), где a — известные, уже датированные летописные династии. Допустим, что мы обнаружили династию a, для которой коэффициент c(a,d) мал, то есть не превышает 10 -8. Это дает нам основание утверждать, что династии a и d зависимы с вероятностью с(a,d). То есть, летописные династии a и d по-видимому соответствуют одной реальной династии M, датировка которой нам уже известна. Тем самым, мы датируем летописную династию a.
Эта методика была проверена на средневековых династиях с заранее известной датировкой. Эффективность методики полностью подтвердилась [416], [438].
Этот же метод позволяет обнаруживать в «скалигеровском учебнике по истории» фантомные дубликаты. А именно, если мы найдем две летописные династии a и b, для которых коэффициент c(a,b) не превышает 10 -8, это дает нам основания предполагать, что перед нами — просто два экземпляра, две версии описания какой-то одной и той же реальной династии M. Которая «размножилась» на страницах разных летописей, помещенных затем в разные места «скалигеровского учебника».
Повторим еще раз, что любые выводы или гипотезы, опирающиеся на «похожесть» или, напротив, «непохожесть» династий, могут считаться осмысленными только в том случае, когда они опираются на обширные численные эксперименты подобные проведенным нами. В противном случае на первое место выступают туманные субъективные соображения, обсуждать которые вряд ли стоит.
3. Принцип затухания частот
Методика упорядочивания исторических текстов во времени
Принцип затухания частот и основанный на нем метод был предложен и разработан в [375]-[377], [379], [381], [385], [390]-[393], [396], [398].
Настоящая методика позволяет находить хронологически правильный порядок отдельных фрагментов текста, обнаруживать в нем дубликаты на основе анализа, например, совокупности собственных имен, упомянутых в тексте. Как и в предыдущих методиках, мы стремимся к созданию метода датировки, основанного на количественных характеристиках текстов и не требующего анализа смыслового содержания текстов, которое может быть весьма многозначно и расплывчато.
Если в документе упомянуты какие-либо «знаменитые», ранее известные нам персонажи, известные из других, уже датированных хроник, то это позволяет датировать описанные в тексте события. Однако если такое отождествление сразу не удается и если, кроме того, описаны события нескольких поколений с большим количеством ранее неизвестных действующих лиц, то задача установления тождества персонажей с ранее известными усложняется. Для краткости назовем фрагмент текста, описывающий события одного поколения, «главой-поколением».
Будем считать, что средняя длительность одного «поколения» — это средняя длительность правления реальных царей, зафиксированных в дошедших до нас летописях. Эта средняя длительность правления была вычислена мною на основании результатов, полученных при обработке хронологических таблиц Блера [20]. Она оказалась равной 17,1 года [375].
Читать дальшеИнтервал:
Закладка: