Плотность вероятности непрерывной случайной величины, ее определение, свойства и график. Функция распределения и плотность вероятности в MS EXCEL Плотность распределения случайной величины определение

Даны определения Функции распределения случайной величины и Плотности вероятности непрерывной случайной величины. Эти понятия активно используются в статьях о статистике сайта . Рассмотрены примеры вычисления Функции распределения и Плотности вероятности с помощью функций MS EXCEL .

Введем базовые понятия статистики, без которых невозможно объяснить более сложные понятия.

Генеральная совокупность и случайная величина

Пусть у нас имеется генеральная совокупность (population) из N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики Х.

Примером генеральной совокупности (ГС) может служить совокупность весов однотипных деталей, которые производятся станком.

Поскольку в математической статистике, любой вывод делается только на основании характеристики Х (абстрагируясь от самих объектов), то с этой точки зрения генеральная совокупность представляет собой N чисел, среди которых, в общем случае, могут быть и одинаковые.

В нашем примере, ГС - это просто числовой массив значений весов деталей. Х – вес одной из деталей.

Если из заданной ГС мы выбираем случайным образом один объект, имеющей характеристику Х, то величина Х является случайной величиной . По определению, любая случайная величина имеет функцию распределения , которая обычно обозначается F(x).

Функция распределения

Функцией распределения вероятностей случайной величины Х называют функцию F(x), значение которой в точке х равно вероятности события X

F(x) = P(X

Поясним на примере нашего станка. Хотя предполагается, что наш станок производит только один тип деталей, но, очевидно, что вес изготовленных деталей будет слегка отличаться друг от друга. Это возможно из-за того, что при изготовлении мог быть использован разный материал, а условия обработки также могли слегка различаться и пр. Пусть самая тяжелая деталь, произведенная станком, весит 200 г, а самая легкая - 190 г. Вероятность того, что случайно выбранная деталь Х будет весить меньше 200 г равна 1. Вероятность того, что будет весить меньше 190 г равна 0. Промежуточные значения определяются формой Функции распределения. Например, если процесс настроен на изготовление деталей весом 195 г, то разумно предположить, что вероятность выбрать деталь легче 195 г равна 0,5.

Типичный график Функции распределения для непрерывной случайной величины приведен на картинке ниже (фиолетовая кривая, см. файл примера ):

В справке MS EXCEL Функцию распределения называют Интегральной функцией распределения (Cumulative Distribution Function , CDF ).

Приведем некоторые свойства Функции распределения:

  • Функция распределения F(x) изменяется в интервале , т.к. ее значения равны вероятностям соответствующих событий (по определению вероятность может быть в пределах от 0 до 1);
  • Функция распределения – неубывающая функция;
  • Вероятность того, что случайная величина приняла значение из некоторого диапазона плотность вероятности равна 1/(0,5-0)=2. А для с параметром лямбда =5, значение плотности вероятности в точке х=0,05 равно 3,894. Но, при этом можно убедиться, что вероятность на любом интервале будет, как обычно, от 0 до 1.

    Напомним, что плотность распределения является производной от функции распределения , т.е. «скоростью» ее изменения: p(x)=(F(x2)-F(x1))/Dx при Dx стремящемся к 0, где Dx=x2-x1. Т.е. тот факт, что плотность распределения >1 означает лишь, что функция распределения растет достаточно быстро (это очевидно на примере ).

    Примечание : Площадь, целиком заключенная под всей кривой, изображающей плотность распределения , равна 1.

    Примечание : Напомним, что функцию распределения F(x) называют в функциях MS EXCEL интегральной функцией распределения . Этот термин присутствует в параметрах функций, например в НОРМ.РАСП (x; среднее; стандартное_откл; интегральная ). Если функция MS EXCEL должна вернуть Функцию распределения, то параметр интегральная , д.б. установлен ИСТИНА. Если требуется вычислить плотность вероятности , то параметр интегральная , д.б. ЛОЖЬ.

    Примечание : Для дискретного распределения вероятность случайной величине принять некое значение также часто называется плотностью вероятности (англ. probability mass function (pmf)). В справке MS EXCEL плотность вероятности может называть даже "функция вероятностной меры" (см. функцию БИНОМ.РАСП() ).

    Вычисление плотности вероятности с использованием функций MS EXCEL

    Понятно, что чтобы вычислить плотность вероятности для определенного значения случайной величины, нужно знать ее распределение.

    Найдем плотность вероятности для N(0;1) при x=2. Для этого необходимо записать формулу =НОРМ.СТ.РАСП(2;ЛОЖЬ) =0,054 или =НОРМ.РАСП(2;0;1;ЛОЖЬ) .

    Напомним, что вероятность того, что непрерывная случайная величина примет конкретное значение x равна 0. Для непрерывной случайной величины Х можно вычислить только вероятность события, что Х примет значение, заключенное в интервале (а; b).

    Вычисление вероятностей с использованием функций MS EXCEL

    1) Найдем вероятность, что случайная величина, распределенная по (см. картинку выше), приняла положительное значение. Согласно свойству Функции распределения вероятность равна F(+∞)-F(0)=1-0,5=0,5.

    НОРМ.СТ.РАСП(9,999E+307;ИСТИНА) -НОРМ.СТ.РАСП(0;ИСТИНА) =1-0,5.
    Вместо +∞ в формулу введено значение 9,999E+307= 9,999*10^307, которое является максимальным числом, которое можно ввести в ячейку MS EXCEL (так сказать, наиболее близкое к +∞).

    2) Найдем вероятность, что случайная величина, распределенная по , приняла отрицательное значение. Согласно определения Функции распределения, вероятность равна F(0)=0,5.

    В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(0;ИСТИНА) =0,5.

    3) Найдем вероятность того, что случайная величина, распределенная по стандартному нормальному распределению , примет значение, заключенное в интервале (0; 1). Вероятность равна F(1)-F(0), т.е. из вероятности выбрать Х из интервала (-∞;1) нужно вычесть вероятность выбрать Х из интервала (-∞;0). В MS EXCEL используйте формулу =НОРМ.СТ.РАСП(1;ИСТИНА) - НОРМ.СТ.РАСП(0;ИСТИНА) .

    Все расчеты, приведенные выше, относятся к случайной величине, распределенной по стандартному нормальному закону N(0;1). Понятно, что значения вероятностей зависят от конкретного распределения. В статье функции распределения найти точку, для которой F(х)=0,5, а затем найти абсциссу этой точки. Абсцисса точки =0, т.е. вероятность, того что случайная величина Х примет значение <0, равна 0,5.

    В MS EXCEL используйте формулу =НОРМ.СТ.ОБР(0,5) =0.

    Однозначно вычислить значение случайной величины позволяет свойство монотонности функции распределения.

    Обратная функция распределения вычисляет , которые используются, например, при . Т.е. в нашем случае число 0 является 0,5-квантилем нормального распределения . В файле примера можно вычислить и другой квантиль этого распределения. Например, 0,8-квантиль равен 0,84.

    В англоязычной литературе обратная функция распределения часто называется как Percent Point Function (PPF).

    Примечание : При вычислении квантилей в MS EXCEL используются функции: НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР(), ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье .

    С помощью рассмотренных дискретных случайных величин невозможно описать реальные случайные эксперименты. Действительно, таким величинам, как размеры любых физических объектов, температура, давление, длительность тех ли иных физических процессов, нельзя приписать дискретное множество возможных значений. Естественно считать, что это множество заполняет какой-то числовой промежуток. Поэтому вводится понятие непрерывной случайной величины.

    Непрерывной случайной величиной называют такую случайную величину Х , множество значений которой – некоторый числовой интервал.

    Рассмотрим примеры непрерывных случайных величин.

    1. Х – промежуток времени между двумя отказами (сбоями) вычислительной машины. Тогда .

    2. Х – высота подъема воды в половодье. В этом случае .

    Ясно, что для непрерывной случайной величины, значения которой сплошь заполняют некоторый интервал оси абсцисс, ряд распределения построить невозможно. Во-первых, нельзя перечислить одно за другим возможные значения и, во-вторых, как мы покажем далее, вероятность отдельного значения непрерывной случайной величины равна нулю.

    В противном случае, т.е. если бы каждому отдельному значению непрерывной случайной величины соотнести ненулевую вероятность, то при суммировании всех вероятностей можно получить число, отличное от единицы, так как множество значений непрерывной случайной величины несчетно (значения заполняют сплошь некоторый интервал).

    Пусть множество содержит несчетное множество значений непрерывной случайной величины Х . Систему подмножеств образуют любые подмножества, которые могут быть полученыиз множества , , путем применения счетного числа раз операций объединения, пересечения, дополнения. Система , следовательно, будет содержать множества вида {х 1 <Х<х 2 }, , , , , , .

    Для определения на этих множествах вероятностноймеры введем понятие плотности распределения вероятностей.

    Определение 2.5. Плотностью распределения вероятностей р(х) непрерывной случайной величины Х называется предел, если он существует, отношения вероятности попадания случайной величины Х на интервал , примыкающей к точке х, к длине этого интервала, когда последняя стремится к нулю т. е.

    (2.4)

    Кривая, изображающая плотность распределения вероятностей (плотность вероятности) непрерывной случайной величины, называется кривой распределения. Например, кривая распределения может иметь вид, как на рис. 2.4.

    Следует отметить, что если р (х) умножить на , то величина р(х) , называемая элементом вероятности, характеризует вероятность того, что Х принимает значения из интервала длиной , примыкающего к точке х. Геометрически – это площадь прямоугольника со сторонами и р(х) (см. рис. 2.4).



    Тогда вероятность попадания непрерывной случайной величины Х на отрезок будет равна сумме элементов вероятности на всем этом отрезке , т.е. площади криволинейной трапеции, ограниченной кривой у = р (х) , осью Ох и прямыми х = а, х = β:

    , (2.5)

    так как площадь заштрихованной фигуры будет стремиться к площади криволинейной трапеции при (рис. 2.5).

    Плотность вероятности обладает следующими свойствами.

    1 °. р(х) 0 , так как предел неотрицательных величин – величина неотрицательная.

    2 °. , так как вероятность того, что непрерывная случайная величина принимает значения из интервала , т.е. вероятность достоверного события равна единице.

    3 °. р(х) - непрерывна или кусочно непрерывна.

    Таким образом, с помощью формулы (2.5) вводится нормированная вероятностная мера на любых подмножествах множества .

    Функция распределения случайной величины Х – это функция F(х) действительной переменной х , определяющая вероятность того, что случайная величина принимает значения, меньшие некоторого фиксированного числа х, т.е. : .

    Тогда из формулы (2.5) следует, что для любых

    . (2.6)

    Геометрически функция распределения есть площадь фигуры, лежащей левее точки х, ограниченной кривой распределения у = р(х) и осью абсцисс. Из формулы (2.6) и теоремы Барроу для случая, когда р (х) непрерывна, следует, что

    р(х) = (2.7)

    Рис.2.6 Рис.2.7

    Это равенство нарушается в точках разрыва плотности вероятностей. График F(х) непрерывной случайной величины Х может иметь вид кривой, приведенной на рис. 2.6.

    Дадим строгое определенне непрерывной случайной величины.

    Определение 2.6. Случайная величина Х называегся непрерывной, если существует неотрицательная функция р(х), что для любых выполняется равенство (2.6).



    Функция распределения F(х), удовлетворяющая равенству (2.6), называется абсолютно непрерывной.

    Итак, функция распределения непрерывной случайной величины задает абсолютно непрерывное распределение случайной величины.

    Для непрерывной случайной величины Х справедлива следующая теорема.

    Теорема 2.4. Вероятнсть отдельного значения непрерывной случайной величины Х равна нулю:

    Доказательство. По теореме 2.3 вероятность отдельного значения равна:

    Так как для непрерывной случайной величины , то .

    Из доказанной теоремы следует справедливость равенств:

    Действительно, , так как и т.д.

    Таким образом, для вычисления вероятностей произвольных событий , где надо задать на множестве значений непрерывной случайной величины либо функцию распределения F(х) , либо плотность распределения вероятностей р(х) .

    Пример 2.4. Случайная величина Х имеет плотность распределения вероятностей

    Найти параметр с и функцию распределения F(х) . Построитьграфики функций р(х) и F(х).

    Решение. Для нахождения параметра с , воспользуемся свойством 2 ○ плотности распределения вероятностей: . Подставив значение плотности, получим . Вычислив интеграл , найдем значение с из равенства: , .

    Плотность распределения вероятностей примет вид

    Поскольку плотность задана при помощи трех формул, то вычисление функции распределения зависит от расположения на числовой оси. Если:

    1) , то воспользовавшись формулой (2.6), получим

    Непрерывная случайная величина может быть задана не только с помощью функции распределения. Введем понятие плотности вероятности непрерывной случайной величины.

    Рассмотрим вероятность попадания непрерывной случайной величины на интервал [х , х + Δх ]. Вероятность такого события

    P (х X х + Δх ) = F (х + Δх ) – F (х ),

    т.е. равна приращению функции распределения F (х ) на этом участке. Тогда вероятность, приходящаяся на единицу длины, т.е. средняя плотность вероятности на участке от х до х + Δх , равна

    Переходя к пределу Δх → 0, получим плотность вероятности в точке х :

    представляющую производную функции распределения F (х ). Напомним, что для непрерывной случайной величины F (х ) – дифференцируемая функция.

    Определение. Плотностью вероятности (плотностью распределения ) f (x ) непрерывной случайной величины Х называется производная ее функции распределения

    f (x ) = F ′(x ). (4.8)

    Про случайную величину Х говорят, что она имеет распределение с плотностью f (x ) на определенном участке оси абсцисс.

    Плотность вероятности f (x ), как и функция распределения F (x ) является одной из форм закона распределения. Но в отличие от функции распределения она существует только для непрерывных случайных величин.

    Плотность вероятности иногда называют дифференциальной функцией или дифференциальным законом распределения . График плотности вероятности называется кривой распределения .

    Пример 4.4. По данным примера 4.3 найти плотность вероятности случайной величины Х .

    Решение. Будем находить плотность вероятности случайной величины как производную от ее функции распределения f (x ) = F "(x ).

    Отметим свойства плотности вероятности непрерывной случайной величины.

    1. Плотность вероятности – неотрицательная функция , т.е.

    Геометрически вероятность попадания в интервал [α , β ,] равна площади фигуры, ограниченной сверху кривой распределения и опирающейся на отрезок [α , β ,] (рис.4.4).

    Рис. 4.4 Рис. 4.5

    3. Функция распределения непрерывной случайной величины может быть выражен через плотность вероятности по формуле :

    Геометрически свойства 1 и 4 плотности вероятности означают, что ее график – кривая распределения – лежит не ниже оси абсцисс, а полная площадь фигуры, ограниченной кривой распределения и осью абсцисс, равна единице.

    Пример 4.5. Функция f (x ) задана в виде:

    Найти: а) значение А ; б) выражение функции распределения F (х ); в) вероятность того, что случайная величина Х примет значение на отрезке .

    Решение. а) Для того, чтобы f (x ) была плотностью вероятности некоторой случайной величины Х , она должна быть неотрицательна, следовательно, неотрицательным должно быть и значение А . С учетом свойства 4 находим:

    , откуда А = .

    б) Функцию распределения находим, используя свойство 3 :

    Если x ≤ 0, то f (x ) = 0 и, следовательно, F (x ) = 0.

    Если 0 < x ≤ 2, то f (x ) = х /2 и, следовательно,

    Если х > 2, то f (x ) = 0 и, следовательно

    в) Вероятность того, что случайная величина Х примет значение на отрезке находим, используя свойство 2 .

    Пусть $X$ -- непрерывная случайная величина с функцией распределения вероятностей $F(x)$. Напомним определение функции распределения:

    Определение 1

    Функцией распределения называется функция $F(x)$ удовлетворяющая условию $F\left(x\right)=P(X

    Так как случайная величина является непрерывной, то, как нам уже известно, функция распределения вероятностей $F(x)$ будет непрерывной функцией. Пусть $F\left(x\right)$ также дифференцируема на всей области определения.

    Рассмотрим интервал $(x,x+\triangle x)$ (где $\triangle x$ - приращение величины $x$). На нем

    Теперь устремляя значения приращения $\triangle x$ к нулю, получим:

    Рисунок 1.

    Таким образом, получаем:

    Плотность распределения, как и функция распределения, - это одна из форм закона распределения случайной величины. Однако закон распределения может быть записан через плотность распределения только для непрерывных случайных величин.

    Определение 3

    Кривая распределения -- это график функции $\varphi \left(x\right)$ плотность распределения случайной величины (рис.1).

    Рисунок 2. График плотности распределения.

    Геометрический смысл 1: Вероятность попадания непрерывной случайной величины в интервал $(\alpha ,\beta)$ равна площади криволинейной трапеции, ограниченной графиком функции распределения $\varphi \left(x\right)$ и прямыми $x=\alpha ,$ $x=\beta $ и $y=0$ (рис. 2).

    Рисунок 3. Геометрическое изображение вероятности попадания непрерывной случайной величины в интервал $(\alpha ,\beta)$.

    Геометрический смысл 2: Площадь бесконечной криволинейной трапеции, ограниченной графиком функции распределения $\varphi \left(x\right)$, прямой $y=0$ и переменной прямой $x$ есть ни что иное как функция распределения $F(x)$(рис. 3).

    Рисунок 4. Геометрическое изображение функции вероятности $F(x)$ через плотность распределения $\varphi \left(x\right)$.

    Пример 1

    Пусть функция распределения $F(x)$ случайной величины $X$ имеет следующий вид.

    Плотность распределения вероятностей дискретной случайной величины

    Пусть случайная величина принимает значения с вероятностями, . Тогда ее функция распределения вероятностей

    где - функция единичного скачка. Определить плотность вероятности случайной величины по ее функции распределения можно с учетом равенства. Однако при этом возникают математические сложности, связанные с тем, что функция единичного скачка, входящая в (34.1), имеет разрыв первого рода при. Поэтому в точке не существует производная функции.

    Для преодоления этой сложности вводится -функция. Функцию единичного скачка можно представить через -функцию следующим равенством:

    Тогда формально производная

    и плотность вероятности дискретной случайной величины определяется из соотношения (34.1) как производная функции:

    Функция (34.4) обладает всеми свойствами плотности вероятности. Рассмотрим пример. Пусть дискретная случайная величина принимает значения с вероятностями, и пусть, . Тогда вероятность - того, что случайная величина примет значение из отрезка может быть вычислена, исходя из общих свойств плотности по формуле:

    поскольку особая точка - функции, определяемая условием, находится внутри области интегрирования при, а при особая точка находится вне области интегрирования. Таким образом,

    Для функции (34.4) также выполняется условие нормировки:

    Отметим, что в математике запись вида (34.4) считается некорректной (неправильной), а запись (34.2) - корректной. Это обусловлено тем, что -функция при нулевом аргументе, и говорят, что не существует. С другой стороны, в (34.2) -функция содержится под интегралом. При этом правая часть (34.2) - конечная величина для любого, т.е. интеграл от -функции существует. Несмотря на это в физике, технике и других приложениях теории вероятностей часто используется представление плотности в виде (34.4), которое, во-первых, позволяет получать верные результаты, применяя свойства - функции, и во-вторых, имеет очевидную физическую интерпретацию.

    Примеры плотностей и функций распределения вероятностей

    35.1. Случайная величина называется равномерно распределенной на отрезке, если ее плотность распределения вероятностей

    где - число, определяемое из условия нормировки:

    Подстановка (35.1) в (35.2) приводит к равенству, решение которого относительно имеет вид: .

    Функция распределения вероятностей равномерно распределенной случайной величины может быть найдена по формуле (33.5), определяющей через плотность:

    На рис. 35.1 представлены графики функций и равномерно распределенной случайной величины.

    Рис. 35.1. Графики функции и плотности распределения


    равномерно распределенной случайной величины.

    35.2. Случайная величина называется нормальной (или гауссовой), если ее плотность распределения вероятностей:

    где, - числа, называемые параметрами функции. При функция принимает свое максимальное значение: . Параметр имеет смысл эффективной ширины. Кроме этой геометрической интерпретации параметры, имеют и вероятностную трактовку, которая будет рассмотрена в последующем.

    Из (35.4) следует выражение для функции распределения вероятностей

    где - функция Лапласа. На рис. 35.2 представлены графики функций и нормальной случайной величины. Для обозначения того, что случайная величина имеет нормальное распределение с параметрами и часто используется запись.


    Рис. 35.2. Графики плотности и функции распределения

    нормальной случайной величины.

    35.3. Случайная величина имеет плотность распределения вероятностей Коши, если

    Этой плотности соответствует функция распределения

    35.4. Случайная величина называется распределенной по экспоненциальному закону, если ее плотность распределения вероятностей имеет вид:

    Определим ее функцию распределения вероятностей. При из (35.8) следует. Если, то

    35.5. Релеевское распределение вероятностей случайной величины определяется плотностью вида

    Этой плотности соответствует функция распределения вероятностей при и равная

    35.6. Рассмотрим примеры построения функции распределения и плотности дискретной случайной величины. Пусть случайная величина - это число успехов в последовательности из независимых испытаний. Тогда случайная величина принимает значения, с вероятностью, которая определяется формулой Бернулли:

    где, - вероятности успеха и неуспеха в одном опыте. Таким образом, функция распределения вероятностей случайной величины имеет вид

    где - функция единичного скачка. Отсюда плотность распределения:

    где - дельта-функция.