Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1)

Тут можно читать онлайн Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) - бесплатно полную версию книги (целиком) без сокращений. Жанр: История, издательство Наука, год 1999. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Методы статистического анализа исторических текстов (часть 1)
  • Автор:
  • Жанр:
  • Издательство:
    Наука
  • Год:
    1999
  • Город:
    Москва
  • ISBN:
    5-02-013542-9
  • Рейтинг:
    3.82/5. Голосов: 111
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 80
    • 1
    • 2
    • 3
    • 4
    • 5

Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) краткое содержание

Методы статистического анализа исторических текстов (часть 1) - описание и краткое содержание, автор Анатолий Фоменко, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru

Книга посвящена новому направлению в современной прикладной статистике. Предлагаются эмпирико-статистические методы распознавания зависимых и независимых текстов, в том числе исторических, т. е. текстов повествовательного характера, например хроник, летописей Эти методы позволяют во многих случаях датировать древние тексты, описанные в них события и могут применяться для анализа текстов самой разной природы, в теории распознавания образов, при анализе генетических кодов, для уточнения дат древней хронологии. Представлен богатый научный материал — результаты статистической обработки хроник, древних астрономических сообщений, летописей. Книга стала уникальным явлением в мировой научной литературе по прикладной статистике.

Для специалистов в области математической статистики и распознавания образов, лингвистики, филологии, хронологии, истории, а также широкого круга читателей.

Методы статистического анализа исторических текстов (часть 1) - читать онлайн бесплатно полную версию (весь текст целиком)

Методы статистического анализа исторических текстов (часть 1) - читать книгу онлайн бесплатно, автор Анатолий Фоменко
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Перейдем к моделированию ошибки (3). Пусть T — это длительность правления. Ясно, что длительность правления можно рассматривать как случайную величину, определенную на «множестве всех царей». Обозначим через g(T) число царей, правивших T лет. В работе [375] я экспериментально вычислил эту гистограмму частот g(T) (плотность распределения указанной случайной величины) на основе данных, приведенных в «Хронологических Таблицах» Ж. Блера [20]. Положим h(T)=1/g(T) и назовем h(T) функцией ошибок (летописцев). Ошибка h(T) в определении длительности T тем больше, чем с меньшей вероятностью случайная величина, — то есть длительность правления, — принимает значение T. Другими словами, небольшие, «короткие» длительности правлений царей лучше поддаются вычислению. Здесь летописец ошибается незначительно. Напротив, большие длительности правлений царей, встречающиеся довольно редко, летописец обычно вычисляет с существенной ошибкой. Чем больше длительность правления, тем большую ошибку он может совершить.

Функция ошибок h(T) для указанной плотности вероятностей случайной величины (длительности правления) была определена экспериментально [375], с. 115. Разобьем отрезок [0,100] целочисленной оси T на десять отрезков одинаковой длины, а именно:

[0,9], [10,19], [20,29], [30,39]… [90,99].

Тогда оказывается, что:

h(T)=2, если T изменяется от 0 до 19,

h(T)=3, если T изменяется от 20 до 29,

h(T)=5([T/10]-1), если T изменяется от 30 до 100.

Здесь через [s] обозначена целая часть числа s. См. рис. 3.34.

Учтем теперь ошибки летописцев при построении «окрестности» точки a. Для этого расширим параллелепипед P'(a,b) до бóльшего параллелепипеда P(a,b), центром которого по-прежнему является точка a, и ортогональными проекциями на координатные оси являются отрезки с концами

[a i— |a i— b i| + h(a i), a i+ |a i— b i| + h(a i)].

Ясно, что параллелепипед P'(a,b) целиком лежит внутри большого параллелепипеда P(a,b). См. рис. 3.33. Диагональю этого большого параллелепипеда является вектор a-b+h(a), где вектор h(a) выглядит так:

h(a)=(h(a 1)….,h(a k)).

Его можно назвать вектором ошибок летописцев.

Итак, мы смоделировали все три основные ошибки, делавшиеся летописцами при подсчете ими длительностей правлений царей. В качестве окончательного коэффициента c(a,b), измеряющего близость или удаленность друг от друга двух династий a и b, мы возьмем следующее число:

число точек из множества vir(D), попавших в P(a,b) c(a,b) = —.

общее число точек в множестве vir(D)

Ясно, что число c(a,b) является интегралом функции плотности z(x) по параллелепипеду P(a,b). На рис. 3.35 число c(a,b) условно изображается объемом призмы, имеющей в качестве основания параллелепипед P(a,b), и ограниченной сверху графиком функции z. Число c(a,b) можно, при желании, интерпретировать как вероятность того, что случайный «династический вектор», распределенный в пространстве R kс функцией плотности z, оказался на расстоянии от точки a, не превышающем расстояния между точками a и b, с учетом ошибки h(a). Другими словами, случайный «династический» вектор, распределенный с функцией плотности z, попал в окрестность P(a,b) точки a, имеющую «радиус» a-b+h(a).

Из предыдущего видно, что роль династий a и b при подсчете коэффициента c(a,b) неодинакова. Династия a была помещена в центр параллелепипеда P(a,b), а династия b определяла его диагональ. Конечно, можно было «уравнять в правах» династии a и b, поступив по аналогии с предыдущим коэффициентом p(X,Y). То есть, можно поменять местами династии a и b, вычислить коэффициент c(b,a), а затем взять среднее арифметическое чисел c(a,b) и c(b,a). Мы этого не делали по двум причинам. Во-первых, как показали конкретные эксперименты, замена коэффициента c(a,b) на его «симметризацию» фактически не меняет получающихся результатов. Во-вторых, в некоторых случаях династии a и b действительно могут быть неравноправными в том смысле, что одна из них может быть оригиналом, а вторая — всего лишь ее дубликатом, фантомным отражением. В этом случае естественно помещать в центр параллелепипеда династию a, претендующую на роль оригинала, а «фантомное отражение» b рассматривать как «возмущение» династии a. Возникающие различия между коэффициентами c(a,b) и c(b,a) хотя и невелики, но могут послужить полезным материалом для дальнейших, более тонких исследований, которых мы пока не проводили.

2.3. Уточнения модели и проведенного вычислительного эксперимента

Сформулированный выше принцип малых искажений проверялся на основе коэффициента c(a,b).

1) Для проверки были использованы хронологические таблицы Ж. Блера [20], содержащие практически все основные хронологические данные (в скалигеровской версии) из истории Европы, Средиземноморья, Ближнего Востока, Египта, Азии от якобы 4000 года до н. э. до 1800 года н. э. Эти данные были затем дополнены списками правителей и их правлений, взятых нами из других таблиц и монографий, как средневековых, так и современных. Упомянем здесь, например, следующие книги: Ш. Бемон, Г. Моно [16], Э. Бикерман [19], Г. Бругш [22], А.А. Васильев [26], Ф. Грегоровиус [46], [47], Д. Эссад [56], Ш. Диль [60], Кольрауш [104], С.Г. Лозинский [125], Б. Низе [145], В.С. Сергеев [187], [188], Chronologie egiptienne [246], F.K. Ginzel [266], L. Ideler [284], L`art de verifier les dates faites historiques [293], T. Mommsen [306], Isaac Newton [314], D. Petavius [327], I. Scaliger [344].

2) Как мы уже отмечали, под династией мы понимаем последовательность фактических правителей страны, безотносительно к из титулатуре и родственным связям. В дальнейшем мы иногда будем, для краткости, условно называть их царями.

3) Из-за наличия соправителей иногда возникают трудности при расположении этих династов в ряд. Мы приняли простейший принцип их упорядочения — по серединам периодов правлений.

4) Последовательность чисел, выражающих длительности правлений всех правителей на протяжении всей истории данного государства (то есть длина последовательности априори не ограничивается), будем называть ДИНАСТИЧЕСКИМ ПОТОКОМ. Подпоследовательности, получающиеся отбрасыванием тех или иных соправителей, назовем ДИНАСТИЧЕСКИМИ СТРУЯМИ. От каждой такой струи требуется, чтобы она была МОНОТОННОЙ, то есть чтобы середины периодов правлений монотонно возрастали. Требуется также, чтобы династическая струя была ПОЛНОЙ, то есть чтобы она без пропусков и разрывов покрывала весь исторический период, охваченный данным потоком. Перекрытия периодов правлений при этом допускаются.

5) В реальных ситуациях по понятным причинам перечисленные выше требования могут быть несколько нарушены. Например, из рассказа летописца может быть год, или несколько лет, междуцарствия. Поэтому приходится разрешать незначительные ПРОБЕЛЫ. Мы допускали лишь такие пробелы, длительность которых не превышает одного года. Кроме того, при анализе династических потоков и струй приходится постоянно иметь в виду возможность искажения подлинной картины в результате описанных выше ошибок (1), (2), (3), допускаемых летописцами.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Анатолий Фоменко читать все книги автора по порядку

Анатолий Фоменко - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Методы статистического анализа исторических текстов (часть 1) отзывы


Отзывы читателей о книге Методы статистического анализа исторических текстов (часть 1), автор: Анатолий Фоменко. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x