Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Кибернетика и программирование
Правильная ссылка на статью:

Аппроксимация кривыми Пирсона плотности распределения суммы независимых одинаково распределенных случайных величин

Голик Феликс Валентинович

доктор технических наук

профессор, Новгородский филиал, Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации

173003, Россия, Новгородская область, г. Великий Новгород, ул. Германа, 31, ауд. 401

Golik Felix Valentinovich

Doctor of Technical Science

Professor, Novgorod Branch of the Russian Academy of National Economy and Public Administration under the auspices of the President of the Russian Federation

173003, Russia, Novgorodskaya oblast', g. Velikii Novgorod, ul. Germana, 31, aud. 401

felix.golik@mail.ru

DOI:

10.7256/2306-4196.2017.2.22583

Дата направления статьи в редакцию:

05-04-2017


Дата публикации:

28-05-2017


Аннотация: Предметом исследования является плотность распределения вероятностей суммы m независимых одинаково распределенных случайных величин. Анализу распределения сумм случайных величин посвящены многочисленные фундаментальные исследования. Теория суммирования была и остается одним из важнейших разделов теории вероятностей. Доказанные в рамках этой теории предельные теоремы позволяют судить о том, какими распределениями можно аппроксимировать суммы случайных величин при больших m. При этом погрешность приближения оценивается предельной ошибкой. Однако в большинстве прикладных задач число суммируемых величин конечно и не велико, а оценки погрешности в виде предельной ошибки оказываются недостаточно точными. Целью настоящего исследования является разработка конструктивного метода аппроксимации плотности распределения суммы конечного числа независимых случайных величин с одинаковым распределением. В качестве аппроксимирующих распределений предложено использовать кривые Пирсона. Такая аппроксимация лишена недостатков, связанных с применением предельных теорем. Она применима при любом числе суммируемых случайных величин m>1. Решение поставленной задачи базируется на методе моментов. Автором предложена рекурсивная формула для расчета начальных моментов суммы независимых случайных величин, что позволило найти центральные моменты суммы, а затем и параметры кривых Пирсона. Доказано, что параметры кривых Пирсона для суммы m случайных величин связаны простыми соотношениями с соответствующими параметрами суммируемой величины. Найдена зависимость расстояния от точки, соответствующей распределению суммы случайных величин в системе координат параметров Пирсона, до точки (0, 3), соответствующей нормальному распределению. По величине этого расстояния можно косвенно судить о возможности применения аппроксимации нормальным распределением. Рассмотрена возможность аппроксимации кривых Пирсона нормальным распределением. Погрешность приближения при этом оценивается как расстояние в -метрике. Получена приближенная формула для оценки погрешности аппроксимации суммы m случайных величин нормальным распределением. Приведены примеры аппроксимации распределения суммы случайных величин, часто встречающихся в задачах статистической радиотехники. В качестве справочного материала приведены точные и полные формулы для основных типов кривых Пирсона. Все полученные результаты применимы при суммировании любых случайных величин, имеющих конечные первые четыре начальных момента. Корректность выводов подтверждена численными расчетами, выполненными в программе MathCad.


Ключевые слова:

случайная величина, кривые Пирсона, плотность распределения, моменты случайной величины, нормальный закон распределения, сумма случайных величин, рекурсивный алгоритм, вероятностная мера, погрешность аппроксимации, метод моментов

УДК:

621.39.1

Abstract: The article is devoted to working out the constructive method of approximation the sum of independent random variables with the same distribution by Pearson curves. The summation theory was and still is one of the key parts of the theory of probability. The limiting theorems are proven within this theory, and they allow one to understand which frequencies may be used for the approximation for the sum so random values with large m. At the same time the approximation error is evaluated by the admissible error. However, in most practical cases the number of the summed values is not large, so the admissible error evaluation may not be sufficiently precise. The purpose of the study is to develop a constructive method for the approximation of the frequency function for the spread of the final sum of  the independent random values with the same frequency. The Pearson curves are then used as approximative frequencies. Such an approximation lacks the defects related to the application of limiting theorems. It is applicable for any number of summed accidental frequencies m>1. The calculated ratios for the initial moments of the final sum of independent random variables are obtained. It is shown that the parameters of the Pearson curves for the sum m of random variables are related by simple ratios with the corresponding parameters of the summed value. The solution used in order to achieve the goal is based upon the moments method. Thе author offers a recursion formula for calculating the starting moments of for the sum of independent random values, allowing to find the central moments of the sum, as well as the parameters for the Pearson curves.  It is proven that there's a dependency between the distance from the point of  The exact expression for the distance from  the point, corresponding to the distribution of the sum of the random variables in the coordinate system of Pearson parameters to the point (0, 3), corresponding to the normal distribution is found. By the distance value, one can indirectly assess the possibility of applying normal approximation. The author studies the possibility for the approximation of Pearson curves with normal distribution. An approximate formula for estimating the error in approximating the sum  of random variables by normal distribution is given. The author provides examples of approximations for the distribution of the sum of random variables are found, which are often met in statistical radio engineering tasks. The reference materials include complete formulae for the key types of Pearson curves. All the obtained results are applicable for any random variables having finite first four initial moments. The correctness of the conclusions is confirmed by numerical calculations performed in the MathCad program.


Keywords:

random variable, Pearson curve, density function, moments of a random variable, normal distribution, sum of random variables, recursive algorithm, probability measure, approximation error, method of the moments

Введение

Исследование вероятностных характеристик сумм независимых случайных величин на протяжении длительного времени является одной из ключевых проблем теории вероятностей. И до сих пор анализу различных стохастических эффектов суммы случайных величин посвящается большое число исследований. Исторически интерес к схеме суммирования появился в связи с созданием и развитием теории ошибок измерений, когда возникло понимание, что ошибки наблюдения некоторой величины формируются под влиянием многих факторов. При этом предполагается, что вклады этих факторов в результат измерения малы и аддитивны, а сами факторы действуют независимо. В рамках этих допущений разработаны классическая и современная теории предельных теорем для сумм независимых случайных величин. Предельные теоремы указывают на возможную аппроксимацию и дают погрешность приближения в виде неравенств. Такие результаты обычно достаточны для решения практических задач, связанных с оценкой погрешности измерения. Однако существует множество задач, в которых число суммируемых величин конечно. В этом случае оценка погрешности аппроксимации оказывается недостаточно точной. Поэтому задачи с конечным числом суммируемых случайных величин решаются путем непосредственного нахождения законов распределения прямыми методами, а предельные теоремы используются в качестве подтверждения правильности полученного результата.

Известно [1, с. 89], что распределение суммы независимых случайных величин можно найти одним из следующих способов:

1) путем вычисления свертки распределений отдельных слагаемых;

2) через характеристические функции;

3) с помощью моментов.

Первые два похода дают точное решение. Однако чаще всего они сопряжены со значительными вычислительными трудностями. Исключение составляют лишь безгранично делимые распределения, перечень которых ограничен.

Метод моментов дает приближенный результат, то есть некоторую аппроксимацию распределения суммы случайных величин. Но при этом расчеты сводятся к достаточно простым вычислениям.

Аппроксимация в этом случае выполняется с помощью:

1) полиномов,

2) нормального распределения с поправками в виде полинома (метод Крамера)
или производных от нормальной плотности распределения (ряды Шарлье),

3) кривых Пирсона.

Методы Шарлье и Крамера пригодны лишь для приближенно нормальных распределений. Полиномиальная аппроксимация не имеет связи с природой случайной величины.

Метод Пирсона лишен этих недостатков. Система кривых Пирсона достаточно универсальна. Существует простой алгоритм определения типа кривой [2, с. 65]. Эти обстоятельства и определили выбор метода аппроксимации, реализованный в настоящей работе.

Целью исследования является разработка конструктивного метода аппроксимации кривыми Пирсона распределения вероятностей конечной суммы независимых одинаково распределенных случайных величин.

В ходе работы над статьей выяснилось, что, несмотря на обилие литературы, найти полное и точное описание уравнений кривых Пирсона не просто. Например, в [1, с. 133] приведены уравнения кривых, а параметры рекомендуется находить через решение вспомогательных уравнений. В других источниках ограничиваются ссылкой на результаты исследования У. Элдертона (W. Elderton), опубликованные в 1938 г. В этой связи считаем целесообразным привести точные и полные (с параметрами) уравнения кривых Пирсона основных типов.

Моменты суммы одинаково распределенных независимых случайных величин

Для определения параметров кривых Пирсона необходимо знание центральных моментов суммы случайных величин. Рассмотрим процедуру их расчета через начальные моменты.

Начальные моменты -го порядка суммы взаимно независимых случайных величин можно найти по одной из формул:

, , ,

где , , плотность, функция распределения вероятностей и закон распределения дискретной случайной величины соответственно.

Основная трудность, возникающая при вычислениях моментов, связана с необходимостью раскрытия суммы при произвольных целочисленных значениях и . Расчеты можно существенно упростить, если ввести рекурсивную функцию, построенную на полиномах Ньютона. Последовательно рассмотрим биномиальное представление суммы при различном числе суммируемых случайных величин.

При

, (1)

где .

При

(2)

В общем случае при можно записать:

. (3)

Искомые начальные моменты суммы случайных величин найдем, усреднив выражения (1)…(3). Так, для начального момента -го порядка суммы двух случайных величин получим:

. (4)

Здесь угловыми скобками обозначена операция математического ожидания, а - начальный момент -го порядка случайной величины :

(5)

Очевидно, что при момент равен

,

а при произвольном :

. (6)

При решении задачи аппроксимации законов распределения методом моментов, используются центральные моменты, связанные с начальными соотношением [1]:

, (7)

где начальный момент суммы случайных величин .

В дальнейшем нам понадобятся моменты не выше четвертого порядка, которые удобней рассчитывать по развернутым формулам:

; (8)

; (9)

. (10)

Подставив в формулы (8…10) выражения для начальных моментов из (4) и (6) с учетом (5) получим более простые соотношения для центральных моментов суммы случайных величин:

, (8а)

, (9а)

. (10а)

Здесь , , центральные моменты соответственно порядка 2, 3, 4 случайной величины .

Кривые Пирсона

Кривые Пирсона (распределения Пирсона) широко используются при аппроксимации распределений случайных величин. Они позволяют аппроксимировать практически все известные статистические распределения.

Пирсон предложил для описания статистического распределения случайной величины использовать решения дифференциального уравнения [3, с. 63]:

, (11)

где – мода.

Коэффициенты в уравнении (11) могут быть вычислены с помощью центральных моментов. Они находятся из соотношений:

, ,

где

. (12)

, (13)

(14)

Дискриминант знаменателя в уравнении (11) равен:

,

где

(15)

Общий интеграл уравнения (11) зависит от вида корней квадратного уравнения и определяется критерием («каппа Пирсона») и дополнительными параметрами [2, с. 278]:

,

,

.

В табл. 1 приведены типы кривых Пирсона и соответствующие им критерии, а так же границы области кривых Пирсона. Граница 1 – это верхняя граница всех распределений, а граница 0 – граница кривых Пирсона.

Таблица 1

Тип кривой

Граница 0

I

II

III

IV

V

VI

VII

Граница 1

Критерии