Империя – II, стр. 127

Эта методика требует значительного объема вычислений на ЭВМ. При применении к хронологическим спискам имен ее результатом является так называемая матрица связей списка, дающая его разложение на систему дублирующих друг друга «слоев». Методика была впервые предложена авторами в [11]. Подробное изложение метода см. в главе 3.

Глава 2. Определение сдвигов в хронологии по гистограммам частот разнесений связанных имен

1. Основные определения

1. 1. Большая колода карт и составляющие ее малые колоды

Вернемся к модельной задаче о колодах карт (уже описанной в предыдущем параграфе), в терминах которой будут сформулированы необходимые определения.

Предположим, что в нашем распоряжении имеется некоторая последовательность карт К (колода карт), которая может содержать повторяющиеся карты. Будем говорить, что колода к содержит дубликаты, если она получена из нескольких одинаковых по составу и порядку более коротких колод карт Х (также содержащих, возможно, повторяющиеся карты), которые были сложены подряд в одну общую колоду ХХ… Х, а затем получившаяся таким образом большая колода была перетасована.

Мы допускаем, что перед тасованием каждый экземпляр исходной колоды Х был как-то искажен. Под искажениями будем понимать случайное исключение, дублирование или замену отдельной карты или же последовательности подряд стоящих карт. Предположим однако, что локальные искажения в различных частях каждой из исходных колод независимы друг от друга.

Если же исследуемая колода дубликатов не содержит (то есть порядок карт в ней не порожден описанным выше механизмом), будем называть порядок карт в колоде правильным.

1. 2. Формулировка проблемы

Задача состоит в том, чтобы по известной последовательности карт в колоде К проверить гипотезу Н0 о том, что порядок карт в К – правильный, то есть К не содержит дубликатов. Если гипотеза Н0 отвергается, то требуется определить величины сдвигов между экземплярами исходной колоды Х, расположенными в колоде К (и не до конца разрушенными при тасовании – см. рис. 17).

Для решения этой задачи сформулируем следствие гипотезы Н0, допускающее проверку методами математической статистики.

1. 3. Разбиение большой колоды

Пусть общее число карт в колоде К равно n и из них m различных. Разобъем колоду К на отрезки одинаковой длины:

К = (К1, К2,…, КN),

где через N обозначено общее количество отрезков разбиения. Пусть каждый из этих отрезков содержит p карт. Разбиение выберем так, чтобы число карт в отрезке разбиения было существенно меньше общего числа карт в колоде К:

p « е 

1. 4. Разнесение пары карт как случайная величина

Рассмотрим конечную вероятностную схему равновероятного выбора с возвращением двух карт из колоды К. Это значит, что происходит случайный равновероятный выбор карты в колоде К, эта карта запоминается и возвращается в колоду.

Затем также равновероятно выбирается вторая карта. Результатом выбора является (случайный) протокол, в котором записаны порядковые номера в колоде обеих выбранных карт k1, k2 в порядке их выбора.

Определим случайную величину з, которую мы назовем разнесением выбранной пары карт. Пусть i1 и i2 – порядковые номера отрезков колоды К, в которых содержатся выбранные карты k1 и k2. По определению положим:

з = i1 – i2.

Таким образом, разнесение з – это абсолютная величина разности номеров отрезков разбиения, содержащих выбранные карты.

1. 5. Локальное искажение летописи – колоды карт

Пусть А – некоторое событие, определяемое заданной структурой колоды К (то есть порядком карт в ней и ее разбиением на отрезки) и выбранной парой карт. Событие А назовем локальным событием (локальным условием), если наступление этого события может быть обеспечено заменой карт в одном из отрезков разбиения колоды К (заменой, возможно зависящей от случая). Другими словами, локальное событие – это такое событие, которое может быть обусловлено локальным искажением колоды К.

Математический пример.

Событие А0, состоящее в том, что в некотором отрезке разбиения содержатся карты сразу обоих выбранных видов является локальным событием. В самом деле, изменив две карты, скажем, в первом отрезке разбиения так, чтобы в нем оказались такие же карты, как и выбранные, мы обеспечим наступление события А0.

Если же говорить об исторических хрониках, моделью которых является колода карт К, то содержательный смысл понятия «локальное событие» состоит в следующем. Такие события, с одной стороны, могут возникать в итоге сознательных действий хрониста или переписчика, а с другой стороны, для их возникновения не требуется переделки всего текста хроники.

Скажем, в примере с событием А0 хронист, включивший в какое-то место хроники имена двух персонажей, сделал это на основании своих вполне осознанных представлений о том, что они жили одновременно (или имели сходную судьбу и т. п.) и ему для этого не надо было перекраивать заново весь текст хроники.

В отличие от этого, глобальные характеристики распределения имен в длинных исторических хрониках, мало чувствительные к их локальным искажениям, не могли контролироваться отдельными хронистами. Изменение глобальных характеристик могло произойти лишь на заключительном этапе компиляции (согласования) крупных хроник и включения их в единую хронологическую шкалу. Поэтому именно глобальные характеристики полезны при исследовании «скрытой» структуры летописей.

1. 6. Локальная связь карт в «правильной колоде» не влияет на глобальное распределение таких же карт

В основе предлагаемой методики лежит следующее интуитивно очевидное утверждение о статистических свойствах правильного порядка карт в колоде К.

Гипотеза

Если колода К не содержала дубликатов или же ее тасование было достаточно полным и структура дубликатов (коротких идентичных друг другу колод) в ней полностью разрушена, то локальное условие, наложенное на пару выбранных карт, не может повлиять на характер глобального распределения таких же карт во всей большой колоде. В частности, локальное условие не должно влиять и на закон распределения случайной величины з вне некоторой окрестности нуля, определяемой радиусом затухания взаимной зависимости отрезков разбиения колоды К.

В самом деле, распределение з является глобальной характеристикой порядка карт в целом и мало чувствительно к хаотичным локальным изменениям этого парядка.

Это значит, что в случае правильного порядка карт в К, условное распределение случайной величины з при условии произвольного локального события А должно совпадать вне некоторой окрестности нуля с безусловным распределением з.

Иначе говоря, из гипотезы Н0 вытекает такое следствие:

Следствие гипотезы H0.

Пусть А – некоторое локальное событие, а е – радиус затухания зависимости между отдельными отрезками разбиения колоды К. (В качестве единицы измерения этого радиуса возьмем длину отрезка разбиения. Таким образом е – целое число.) Тогда распределение Pз = x|A, з» е должно совпадать с распределением

Pз = x|з» е.

С другой стороны, в случае, когда гипотеза Н0 неверна и колода К содержит дубликаты, указанные распределения могут очень сильно разниться на всем интервале возможных значений случайной величины з (0 « з « N-1).