Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Историческая информатика
Правильная ссылка на статью:

Кого нет, того и сосчитать (или еще раз к вопросу о численности генуэзских купцов в Византии)

Шпирко Сергей Валерьевич

кандидат физико-математических наук, кандидат исторических наук

доцент, Российский Государственный Гуманитарный Университет, Историко-Архивный институт

119313, Россия, г. Москва, Ленинский проспект, 88, корп. 3

Shpirko Sergey

Associate Professor, Moscow State Historical Archives Institute, Russian State University for the Humanities

119313, Russia, g. Moscow, ul. Leninskii Prospekt, 88 korpus 3, kv. 122

shpirkos@mail.ru
Другие публикации этого автора
 

 

DOI:

10.7256/2585-7797.2021.2.36061

Дата направления статьи в редакцию:

04-07-2021


Дата публикации:

13-07-2021


Аннотация: Предметом исследования является разработка математико-статистического подхода к задаче оценивания численности генуэзского средневекового населения Византии. Источником данных являются нотариальные акты о торговых товариществах, наймах судов, завещаний, купли и продажи домов, товаров и людей, составленные в генуэзской колонии Константинополя в конце XIII века. Формуляр акта имеет довольно однородную структуру. Помимо обязательного упоминания в тексте имен договаривающихся сторон и свидетелей сделки, он также может в зависимости от ее типа содержать имена опекунов, получателей завещания и других третьих лиц. Таким образом, эти данные по клиентеле генуэзских нотариев представляют из себя довольно внушительный и ценный массив информации, который может косвенным образом свидетельствовать о численности всей торговой генуэзской общины Византии. В основе предложенного подхода лежит построенная формализованная модель, описывающая поведение купцов при посещении и заключении сделки у нотария. Это позволяет перейти естественным образом от исходной к статистической задаче оценивания размера конечной совокупности и использовать для ее расчета аппарат данной математической теории. В этом случае автор применяет подход, связанный с использованием функции максимального правдоподобия, что является новизной. Полученная при этом формула позволяет с определенной долей вероятности оценить искомую численность генуэзского населения. Интересно, что эта оценка в целом совпадает с результатом А.Л. Пономарева, полученным ранее для той же задачи с применением эмпирического закона Ципфа.


Ключевые слова:

Константинополь, генуэзцы, нотариальные акты, ранжированный ряд, статистическое оценивание, случайная выборка, объем конечной совокупности, полиномиальное распределение, метод максимального правдоподобия, закон Ципфа

Abstract: The author develops a mathematical-statistical approach to the problem of estimating the size of Genoese medieval population in Byzantium. The data source is notarial acts covering commercial partnerships, freightage, wills, purchase and sale of houses, goods and people drawn up in the Genoese colony of Constantinople at the end of the 13th century. The will form has a fairly uniform structure. In addition to the mandatory record of names of the contracting parties and witnesses of the transaction, it may also register names of the third parties. Thus, these data on the clientele of Genoese notaries represent a dataset which may indirectly indicate the size of the entire trading Genoese community of Byzantium. This approach is based on a constructed formalized model that describes the behavior of merchants when visiting and concluding a transaction attested by a notary. This makes it possible to pass in a natural way from the initial to the statistical problem of estimating the size of a finite aggregate and use this mathematical theory for its calculation. In this case, the author applies the approach associated with the use of the maximum likelihood function that is a novelty. The resulting formula allows (with a certain degree of probability) one to estimate the required size of the Genoese population. It is interesting that this estimate, on the whole, coincides with the result of A.L. Ponomarev obtained earlier for the same problem using Zipf's empirical law.


Keywords:

Constantinople, Genoese, notarial acts, ranged series, statistical estimation, sample, size of a finite population, multinomial distribution, maximum likelihood estimation, Zipf’s law

I. Введение

Одной из интересных и захватывающих тем в исторических исследованиях является математическое, формализованное оценивание какого-либо неизвестного показателя по косвенным данным массовых источников. В частности, проблеме реконструкции численности генуэзской торговой общины в Византии посвящен ряд работ яркого, талантливого, но, к сожалению, рано ушедшего от нас историка Андрея Леонидовича Пономарева. Настоящая статья, можно сказать, подхватывает эту проблематику и предлагает для решения этой задачи использовать развитый математический аппарат статистического оценивания.

Вдохновленные Нимфейским договором 1261 года, генуэзцы, а если брать шире – жители Лигурийского побережья, развили уже к началу 1280-х годов в Византии бурную коммерческую деятельность, о чем красноречиво свидетельствуют многочисленные акты о торговых товариществах, наймах судов, завещаний, купли и продажи домов, товаров и людей. Один отрывок из хроники Никифора Григоры, относящийся, правда, к несколько более позднему времени, дает представление о масштабах деятельности генуэзской торговой общины: “их ежегодный доход от пошлин обратился, примерно, в 200 тысяч, а у византийцев он с трудом доходил до 30 тысяч”[1]. Вместе с тем ни один источник не говорит хотя бы приблизительно о численности этой общины. В связи с этой задачей А.Л. Пономарев привлекает опубликованные Г. Брэтиану в 1927 году акты в той их части, которые были составлены в 1281 году Габриэлем де Предоно, нотарием города Пера – генуэзской колонии напротив Константинополя [2].

Необходимо отметить, что далеко не все генуэзцы в Пере являлись клиентами Предоно. А те персоналии, которые упоминались в его актах, могли заключать сделки и у других нотариев. Несмотря на такую непростую картину, А.Л. Пономарев показывает как, зная частоты упоминания клиентов Предоно, можно оценить приблизительную численность клиентелы всех генуэских нотариев в Пере [3].

Для решения этой задачи реконструкции А.Л. Пономарев сначала строит формализованную вероятностную модель, описывающую поведение генуэзских купцов при заключении сделок и посещении нотария. Так, ученый представляет это как цепной процесс, в котором совершение очередной сделки у данного нотария обусловлено успешным совершением предыдущей у того же нотария. Другими словами, чем больше купец заключил сделок, тем больше вероятность что он заключит ее еще раз.

Учет указанных феноменов “успеха” и “склонности” А.Л. Пономарев проводит с помощью комбинации двух отрицательных биномиальных распределений [4, с.171-174], что позволяет получить формулу частоты упоминания различных персоналий в нотариальных актах Предоно. Отсюда ученый определяет и число персоналий, либо не упомянутых в его актах, либо совершавших сделки у других нотариев, либо вообще их не посещавших (общее число генуэзцев в Пере как 1786 против 507, упомянутых у Предоно). В то же время А.Л. Пономарев указывает и на недостаток предложенного подхода, заключающийся в необходимости учета дополнительного параметра–прогнозируемого числа генуэзцев, который строго не определяется.

В последующей своей статье ученый для описания зависимости между количеством упоминаний и числом купцов, отмеченных не менее, чем указанное число раз, предлагает использовать закон Ципфа, который весьма часто используется для анализа ранжированных рядов (например, частоты цитирования работ различных авторов) [5]. А.Л. Пономарев расширяет этот закон и на случай нулевого числа упоминаний, что приводит ученого к пересмотру прежней оценки численности купцов (645-650 человек).

Вместе с тем А.Л. Пономарев указывает и на один важный недостаток предложенного подхода – параметры закона Ципфа не имеют качественного наполнения, отчего этот закон описывает совокупность данных, но не объясняет их структуру. Для устранения этих недостатков при реконструкции общей численности автор настоящей статьи предлагает использовать новый подход, основанный на применении математического аппарата статистического оценивания.

II. Неформальное введение в статистическое оценивание объема конечной совокупности

Обозначим через N – число элементов (объем) генеральной совокупности, а через n – число элементов ее выборки. Будем считать (и это существенно!), что элементы попадают в выборку случайным образом, а затем возвращаются обратно в генеральную совокупность. Такая выборка называется выборкой с возвращением. То есть один и тот же элемент может встречаться в выборке несколько раз.

Интуитивно понятно, что чем чаще встречаются элементы в случайной выборке, чем меньше в ней число i различных элементов, тем правдоподобней выглядит гипотеза, что объем n выборки соразмерен с объемом N всей генеральной совокупности. На этом, по сути, и основана идея оценивания числа N. В данной статье автор следует подходу, основанному на применении принципа максимального правдоподобия [6]. Суть этого принципа состоит в предположении, что вся информация о выборке содержится в функции правдоподобия. В нашем случае эта функция представляет из себя формулу для совместной вероятности выборки, зависящей от N как от своего параметра. Подставляя в эту функцию реальные выборочные данные и максимизируя ее по параметру N, получаем наиболее “правдоподобную”, близкую к реальности величину объема генеральной совокупности.

Итак, исходя из нашего предположения о случайности выборки, вероятности оказаться в ней для каждого элемента генеральной совокупности одинаковы и равны 1/N. Наша задача состоит в оценивании величины N при условии, что число i различных элементов, оказавшихся в выборке объема n, известно. Вероятность того, что в выборке размера n первый элемент из генеральной совокупности содержится n1раз, второй элемент–n2 раза, …, последний – nN раза, носит название полиномиального распределения [4, с.174-175] и равна

1

где через n! обозначен факториал числа n: n=n(n-1)(n-2)..2·1, и n = n1+n2+..+nN.

Отсюда вероятность того, что ровно i различных элементов встретятся в выборке размера n равна

2

где через СNi обозначено число сочетаний из N по i: СNi=N!/(i! (N-i)!)), а через Σ – операция суммирования по всем наборам (n1,..,ni), таким, что nj>0 (j=1,2,..,i) и n1+n2+..ni=n, то есть все наборы состоят из положительных чисел, в сумме дающих величину n объема выборки.

Заметим, что в последней формуле от величины N зависят только первые два множителя. Поэтому для решения задачи максимизации функции правдоподобия достаточно ограничиться анализом функции f(N,n,i):

3

Максимальное значение эта функция в точке N0 принимает тогда и только тогда, когда выполняются два неравенства:

f(N0-1,n,i) ≤ f(N0,n,i) и f(N0,n,i) ≥ f(N0+1,n,i),

что эквивалентно выполнению двух неравенств с участием натуральных логарифмов ln:

ln N0 – ln(N0-i) ≥ n (ln N0 – ln(N0-1)) и ln(N0+1) - ln(N0-i+1) ≤ n (ln(N0+1) - ln N0).

Обозначив через S(N,i) функцию

4 ,

мы приходим к более простой записи предыдущих двух условий:

S(N0,i) nS(N0-1,i).

Отметим, что функция S(N,i) (таблица ее значений частично приведена в Приложении 1) убывает с ростом N при фиксированном i. Поэтому, подставив в последние два неравенства реальные выборочные значения i и n, находим искомую оценку для объема генеральной совокупности как наименьшее значение параметра N, при котором целая часть от S(N,i) не превосходит n: ]S(N,i)[ n.

III. Численные эксперименты

Апробация предложенного автором подхода была проведена на том же материале, что и у А.Л. Пономарева – 149 актов Предоно, составленных в Пере с июня по октябрь 1281 года. Все они распадаются на несколько типов, наиболее часто встречающимся из которых является договор комменды [7]. Несмотря на однородность формуляра актов, идентификация упомянутых в них некоторых персоналий трудновыполнима. Так, довольно часто в актах упоминаются персоналии без указания фамилий, с одними именами или со схожими именами, как например Ogerius [2, с.89], Ogerinus [2, с.91]. И лишь дополнительное указание их профессии или должности (например, placerius peliparius) позволяет идентифицировать их как одно лицо. К тому же, весьма часто одно и то же лицо выступает в документах в разных ролях. Так, тот же Ogerius в одних договорах комменды выступает в качестве трактатора (accomendatarius, то есть партнера, получающего средства от коммендатора для ведения торговли в установленном месте), в других договорах – в роли свидетеля, а в актах завещания – в роли получателя по завещанию.

Решение подобной задачи идентификации было существенно облегчено созданием автором базы данных на Access (схему данных и структуру таблиц см. Приложение 2). Всего в актах было идентифицировано 447 персоналий, которые были упомянуты 866 раз (сюда включены и женщины). В то же время рабы, как объекты сделок купли/продажи, в рассмотрение не брались. Ниже приведен график частот упоминания отдельных персоналий, упорядоченный по неубыванию.

1_01

Рис. 1 Ранжированный ряд упоминаний персоналий в актах Предоно 1281 года

Первому рангу (максимальная частота – 68 упоминаний) соответствует одно лицо – нотарий Guglielmo Gandulfi, почти постоянно привлекавшийся в качестве свидетеля договора. Все остальные лица упоминаются существенно меньшее число раз, что приводит к существенной масштабируемости графика на рис.1. Для повышения наглядности ниже приводится тот же график, но без учета этой максимальной частоты:

Рис. 2 Ранжированный ряд упоминаний персоналий в актах Предоно 1281 года без первого ранга

Как мы видим, вторая по величине частота равна 16. Она соответствует меховщику Buongiovannino de S.Ambrogio, выступавшему и как свидетель и как сторона договора комменды (трактатор, коммендатор). Следующие по величине частоты (до 9 упоминаний) соответствуют восьми персоналиям, включая упомянутого Ogeriusа – меховщика и одновременно должностного лица консула. В общей сумме они упоминаются 82 раза. Остальные 437 персоналий упоминаются каждый от 8 до 1 раза.

Напомним, что необходимым условием применения предложенного подхода является случайность выборки (это значит, что частота упоминаний, рассматриваемая как случайная величина, имеет равномерное распределение). Простое визуальное наблюдение графика частот на обоих рисунках не позволяет с этим согласиться, что и подтверждается применением критерия χ2 (Пирсона).

Однако, если убрать из рассмотрения первые по частоте 10 персоналий (которые ранее нами были охарактеризованы), то с уровнем значимости 0,1 (то есть достаточно малой вероятностью, при которой событие уже можно считать неслучайным) данное распределение уже будет равномерным. Далее, после удаления указанных 10 элементов объем n выборки сокращается с 866 до 700, а число различных элементов i в ней становится равным 437 (вместо прежних 447). При этом рассчитанное по формуле значение χ2 статистики равно 448,6857, что меньше соответствующего квантиля, равного 475,2005 [8]. Все это позволяет перейти к оцениванию объема N генеральной совокупности. Обращаясь к таблице из Приложения 1, получаем: N=678+10=688. Понятно, что это является верхним значением. Так, если мы вернем в рассмотрение исключенные ранее первые 10 элементов и предположим чисто гипотетически, что выборка все же останется случайной, то получающаяся оценка для N становится только меньше (и равной 573).

Все это позволяет сделать вывод, что при заданном уровне значимости 0,1 число потенциальных клиентов генуэзских адвокатов Перы не превосходит величины, равной 688 человек. Довольно неожиданно, что это значение весьма близко результатам А.Л. Пономарева (645-650 купцов), полученным с помощью использования закона Ципфа, а не вероятностного подхода. Необходимо еще раз отметить, что все вышеперечисленные выводы справедливы лишь при условии, что все свои сделки купцы оформляют у нотариев, и выбор того или иного нотария равновероятен.

Приложение 1

Таблица значений функции ]S(i+j,i)[ для определения объема генеральной совокупности (округленные до целых значений функции обозначены квадратными скобками )

j

i

1

2

3

4

5

..

124

125

126