Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1)

Тут можно читать онлайн Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) - бесплатно полную версию книги (целиком) без сокращений. Жанр: История, издательство Наука, год 1999. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Методы статистического анализа исторических текстов (часть 1)
  • Автор:
  • Жанр:
  • Издательство:
    Наука
  • Год:
    1999
  • Город:
    Москва
  • ISBN:
    5-02-013542-9
  • Рейтинг:
    3.82/5. Голосов: 111
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 80
    • 1
    • 2
    • 3
    • 4
    • 5

Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) краткое содержание

Методы статистического анализа исторических текстов (часть 1) - описание и краткое содержание, автор Анатолий Фоменко, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru

Книга посвящена новому направлению в современной прикладной статистике. Предлагаются эмпирико-статистические методы распознавания зависимых и независимых текстов, в том числе исторических, т. е. текстов повествовательного характера, например хроник, летописей Эти методы позволяют во многих случаях датировать древние тексты, описанные в них события и могут применяться для анализа текстов самой разной природы, в теории распознавания образов, при анализе генетических кодов, для уточнения дат древней хронологии. Представлен богатый научный материал — результаты статистической обработки хроник, древних астрономических сообщений, летописей. Книга стала уникальным явлением в мировой научной литературе по прикладной статистике.

Для специалистов в области математической статистики и распознавания образов, лингвистики, филологии, хронологии, истории, а также широкого круга читателей.

Методы статистического анализа исторических текстов (часть 1) - читать онлайн бесплатно полную версию (весь текст целиком)

Методы статистического анализа исторических текстов (часть 1) - читать книгу онлайн бесплатно, автор Анатолий Фоменко
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Другой летописец, описывая ту же самую реальную династию M, возможно припишет этим же царям несколько другие длительности правлений. В результате получится другая летописная династия b=(b 1, b 2….,b k). Таким образом, одна и та же реальная династия M, но описанная в разных летописях, может изображаться в них разными летописными династиями a и b. Спрашивается, насколько велики возникающие искажения? При этом существенную роль играют ошибки и объективные трудности, препятствующие точному определению реальных длительностей правлений. Основные типы ошибок мы опишем ниже.

Сформулируем статистическую модель, гипотезу, которую мы условно назовем «ПРИНЦИПОМ МАЛЫХ ИСКАЖЕНИЙ».

Принцип малых искажений длительностей правлений.

Если две летописные династии a и b «мало» отличаются друг от друга, то они изображают одну и ту же реальную династию M, то есть являются двумя вариантами ее описания (в разных летописях). В этом случае летописные династии назовем ЗАВИСИМЫМИ.

Напротив, если же две летописные династии a и b изображают две различные реальные династии M и N, то они «значительно» отличаются друг от друга. В этом случае назовем их НЕЗАВИСИМЫМИ.

Остальные пары династий мы назовем НЕЙТРАЛЬНЫМИ.

Другими словами, согласно этой гипотезе-модели, РАЗНЫЕ ЛЕТОПИСЦЫ «МАЛО» ИСКАЖАЛИ ОДНУ И ТУ ЖЕ РЕАЛЬНУЮ ДИНАСТИЮ ПРИ НАПИСАНИИ СВОИХ ЛЕТОПИСЕЙ. Во всяком случае, возникавшие разночтения оказывались «в среднем» меньше, чем имеющиеся различия между заведомо разными, то есть независимыми реальными династиями.

Сформулированная выше гипотеза, модель нуждается в экспериментальной проверке. В случае ее справедливости мы обнаруживаем важное, и отнюдь не очевидное свойство, характеризующее деятельность древних летописцев. А именно, ЛЕТОПИСНЫЕ ДИНАСТИИ, ВОЗНИКАВШИЕ ПРИ ОПИСАНИИ ОДНОЙ И ТОЙ ЖЕ РЕАЛЬНОЙ ДИНАСТИИ, ОТЛИЧАЮТСЯ ДРУГ ОТ ДРУГА И ОТ СВОЕГО ПРОТОТИПА, МЕНЬШЕ, ЧЕМ ОТЛИЧАЮТСЯ ДРУГ ОТ ДРУГА ДВЕ ДЕЙСТВИТЕЛЬНО РАЗНЫЕ РЕАЛЬНЫЕ ДИНАСТИИ.

Существует ли естественный числовой коэффициент (мера) c(a,b), вычисляемый для каждой пары летописных династий a и b и обладающий тем свойством, что он «мал» для зависимых династий и, напротив, «велик» для независимых? Другими словами, этот коэффициент должен различать зависимые и независимые династии. Такой коэффициент был нами найден.

Оказывается, для оценки «близости» двух династий a и b можно ввести числовой коэффициент c(a,b), аналогичный описанному выше коэффициенту ВССД = p(X,Y). Этот коэффициент с(a,b) также имеет смысл вероятности. Сначала опишем грубую идею определения коэффициента с(a,b). Летописную династию удобно изображать в виде графика, отложив по горизонтали номера царей, а по вертикали — длительности их правлений. Мы скажем, что династия q «похожа» на две династии a и b, если график династии q отличается от графика династии a не больше, чем график династии b отличается от графика династии a. Подробности см. ниже и в [416], [419], [376], [377], [375].

В качестве с(a,b) берется доля, которую династии, «похожие» на династии a и b, составляют во множестве всех династий. Другими словами, подсчитывается отношение:

количество династий, «похожих» на a и b

общее количество династий, описанных в летописях

Длительности правлений царей могут определяться летописцами с ошибкой. Фактически мы извлекаем из летописей лишь некоторые приближенные их значения. Можно математически описать вероятностные механизмы, приводящие к появлению этих ошибок. Кроме того, мы учитывали еще две возможные ошибки летописцев: перестановка двух соседних царей и замена двух соседних царей одним «царем» с суммарной длительностью правления.

Коэффициент c(a,b) можно условно назвать ВССД, то есть вероятностью случайного совпадения династий a и b.

2.2. Статистическая модель

Дадим теперь формальное определение коэффициента c(a,b). Обозначим через D множество всех реальных династий длины k, то есть состоящих из k последовательных царей. Фактически за множество D нам придется взять те исторические династии, сведения о которых дошли до нас в сохранившихся исторических хрониках. Практически полный список всех таких династий мы составили на основе большого числа разнообразных хронологических таблиц, перечисленных ниже. На основе этих таблиц мы составили список всех групп из 15 последовательных царей, правивших, согласно скалигеровской хронологии, в интервале от 4000 года до н. э. до 1900 года н. э. в Европе, Средиземноморье, на Ближнем Востоке, в Египте, Азии.

Каждую летописную династию можно условно изобразить вектором в евклидовом пространстве R kразмерности k. В нашем конкретном эксперименте мы брали k=15 (см. выше). Мы будем считать две династии существенно различными, если число царей (или реальных правителей), входящих одновременно в обе эти династии, не превышает k/2, то есть половины числа членов всей династии. Две взятые наугад реальные династии могут пересекаться, поскольку каждый раз мы можем произвольно объявить того или иного царя «началом династии». Наряду с зависимыми и независимыми династиями имеются еще и «промежуточные», «нейтральные» пары династий, в которых число общих царей (или реальных правителей) превышает k/2. Ясно, что если общее число рассматриваемых династий велико, то количество промежуточных, нейтральных пар династий относительно мало. Поэтому основное внимание можно уделять зависимым и независимым парам династий.

Сформулированный выше принцип малых искажений означает, что на практике, «в среднем», летописцы ошибались все-таки незначительно, то есть не очень сильно искажали реальные числовые данные.

Обсудим теперь ошибки, которые чаще всего делали летописцы при вычислении длительностей правлений древних царей. Эти три типа ошибок были выделены нами при обработке большого числа конкретных исторических текстов. Выяснилось, что именно эти ошибки чаще всего приводили к искажению реальных длительностей правлений царей.

Ошибка (1). Перестановка, путаница двух соседних царей.

Ошибка (2). Замена двух царей одним, длительность правления которого равна сумме длительностей их правлений.

Ошибка (3). Неточность в вычислении самой длительности правления.

Чем больше эта длительность правления, тем большую ошибку обычно допускал летописец при ее определении.

Эти три типа ошибок можно описать и смоделировать математически. Начнем с ошибок (1) и (2). Рассмотрим какую-либо династию p=(p 1,p 2….,p k) из множества D. Вектор q=(q 1,q 2….,q k) мы назовем ВИРТУАЛЬНОЙ ВАРИАЦИЕЙ вектора (династии) p, и будем обозначать его через q=vir(p), если каждая координата q iвектора c получается из координат вектора p одной из следующих двух процедур (1) и (2).

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Анатолий Фоменко читать все книги автора по порядку

Анатолий Фоменко - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Методы статистического анализа исторических текстов (часть 1) отзывы


Отзывы читателей о книге Методы статистического анализа исторических текстов (часть 1), автор: Анатолий Фоменко. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x