Функция распределения для функции плотности вероятностей. Плотность вероятности непрерывной случайной величины, ее определение, свойства и график

Даны определения Функции распределения случайной величины и Плотности вероятности непрерывной случайной величины. Эти понятия активно используются в статьях о статистике сайта . Рассмотрены примеры вычисления Функции распределения и Плотности вероятности с помощью функций MS EXCEL .

Введем базовые понятия статистики, без которых невозможно объяснить более сложные понятия.

Генеральная совокупность и случайная величина

Пусть у нас имеется генеральная совокупность (population) из N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики Х.

Примером генеральной совокупности (ГС) может служить совокупность весов однотипных деталей, которые производятся станком.

Поскольку в математической статистике, любой вывод делается только на основании характеристики Х (абстрагируясь от самих объектов), то с этой точки зрения генеральная совокупность представляет собой N чисел, среди которых, в общем случае, могут быть и одинаковые.

В нашем примере, ГС - это просто числовой массив значений весов деталей. Х – вес одной из деталей.

Если из заданной ГС мы выбираем случайным образом один объект, имеющей характеристику Х, то величина Х является случайной величиной . По определению, любая случайная величина имеет функцию распределения , которая обычно обозначается F(x).

Функция распределения

Функцией распределения вероятностей случайной величины Х называют функцию F(x), значение которой в точке х равно вероятности события X

F(x) = P(X

Поясним на примере нашего станка. Хотя предполагается, что наш станок производит только один тип деталей, но, очевидно, что вес изготовленных деталей будет слегка отличаться друг от друга. Это возможно из-за того, что при изготовлении мог быть использован разный материал, а условия обработки также могли слегка различаться и пр. Пусть самая тяжелая деталь, произведенная станком, весит 200 г, а самая легкая - 190 г. Вероятность того, что случайно выбранная деталь Х будет весить меньше 200 г равна 1. Вероятность того, что будет весить меньше 190 г равна 0. Промежуточные значения определяются формой Функции распределения. Например, если процесс настроен на изготовление деталей весом 195 г, то разумно предположить, что вероятность выбрать деталь легче 195 г равна 0,5.

Типичный график Функции распределения для непрерывной случайной величины приведен на картинке ниже (фиолетовая кривая, см. файл примера ):

В справке MS EXCEL Функцию распределения называют Интегральной функцией распределения (Cumulative Distribution Function , CDF ).

Приведем некоторые свойства Функции распределения:

  • Функция распределения F(x) изменяется в интервале , т.к. ее значения равны вероятностям соответствующих событий (по определению вероятность может быть в пределах от 0 до 1);
  • Функция распределения – неубывающая функция;
  • Вероятность того, что случайная величина приняла значение из некоторого диапазона плотность вероятности равна 1/(0,5-0)=2. А для с параметром лямбда =5, значение плотности вероятности в точке х=0,05 равно 3,894. Но, при этом можно убедиться, что вероятность на любом интервале будет, как обычно, от 0 до 1.

    Напомним, что плотность распределения является производной от функции распределения , т.е. «скоростью» ее изменения: p(x)=(F(x2)-F(x1))/Dx при Dx стремящемся к 0, где Dx=x2-x1. Т.е. тот факт, что плотность распределения >1 означает лишь, что функция распределения растет достаточно быстро (это очевидно на примере ).

    Примечание : Площадь, целиком заключенная под всей кривой, изображающей плотность распределения , равна 1.

    Примечание : Напомним, что функцию распределения F(x) называют в функциях MS EXCEL интегральной функцией распределения . Этот термин присутствует в параметрах функций, например в НОРМ.РАСП (x; среднее; стандартное_откл; интегральная ). Если функция MS EXCEL должна вернуть Функцию распределения, то параметр интегральная , д.б. установлен ИСТИНА. Если требуется вычислить плотность вероятности , то параметр интегральная , д.б. ЛОЖЬ.

    Примечание : Для дискретного распределения вероятность случайной величине принять некое значение также часто называется плотностью вероятности (англ. probability mass function (pmf)). В справке MS EXCEL плотность вероятности может называть даже "функция вероятностной меры" (см. функцию БИНОМ.РАСП() ).

    Вычисление плотности вероятности с использованием функций MS EXCEL

    Понятно, что чтобы вычислить плотность вероятности для определенного значения случайной величины, нужно знать ее распределение.

    Найдем плотность вероятности для N(0;1) при x=2. Для этого необходимо записать формулу =НОРМ.СТ.РАСП(2;ЛОЖЬ) =0,054 или =НОРМ.РАСП(2;0;1;ЛОЖЬ) .

    Напомним, что вероятность того, что непрерывная случайная величина примет конкретное значение x равна 0. Для непрерывной случайной величины Х можно вычислить только вероятность события, что Х примет значение, заключенное в интервале (а; b).

    Вычисление вероятностей с использованием функций MS EXCEL

    1) Найдем вероятность, что случайная величина, распределенная по (см. картинку выше), приняла положительное значение. Согласно свойству Функции распределения вероятность равна F(+∞)-F(0)=1-0,5=0,5.

    НОРМ.СТ.РАСП(9,999E+307;ИСТИНА) -НОРМ.СТ.РАСП(0;ИСТИНА) =1-0,5.
    Вместо +∞ в формулу введено значение 9,999E+307= 9,999*10^307, которое является максимальным числом, которое можно ввести в ячейку MS EXCEL (так сказать, наиболее близкое к +∞).

    2) Найдем вероятность, что случайная величина, распределенная по , приняла отрицательное значение. Согласно определения Функции распределения, вероятность равна F(0)=0,5.

    В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(0;ИСТИНА) =0,5.

    3) Найдем вероятность того, что случайная величина, распределенная по стандартному нормальному распределению , примет значение, заключенное в интервале (0; 1). Вероятность равна F(1)-F(0), т.е. из вероятности выбрать Х из интервала (-∞;1) нужно вычесть вероятность выбрать Х из интервала (-∞;0). В MS EXCEL используйте формулу =НОРМ.СТ.РАСП(1;ИСТИНА) - НОРМ.СТ.РАСП(0;ИСТИНА) .

    Все расчеты, приведенные выше, относятся к случайной величине, распределенной по стандартному нормальному закону N(0;1). Понятно, что значения вероятностей зависят от конкретного распределения. В статье функции распределения найти точку, для которой F(х)=0,5, а затем найти абсциссу этой точки. Абсцисса точки =0, т.е. вероятность, того что случайная величина Х примет значение <0, равна 0,5.

    В MS EXCEL используйте формулу =НОРМ.СТ.ОБР(0,5) =0.

    Однозначно вычислить значение случайной величины позволяет свойство монотонности функции распределения.

    Обратная функция распределения вычисляет , которые используются, например, при . Т.е. в нашем случае число 0 является 0,5-квантилем нормального распределения . В файле примера можно вычислить и другой квантиль этого распределения. Например, 0,8-квантиль равен 0,84.

    В англоязычной литературе обратная функция распределения часто называется как Percent Point Function (PPF).

    Примечание : При вычислении квантилей в MS EXCEL используются функции: НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР(), ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье .

    Задание 1 . Плотность распределения непрерывной случайной величины Х имеет вид:
    Найти:
    а) параметр A ;
    б) функцию распределения F(x) ;
    в) вероятность попадания случайной величины X в интервал ;
    г) математическое ожидание MX и дисперсию DX .
    Построить график функций f(x) и F(x) .

    Задание 2 . Найти дисперсию случайной величины X , заданной интегральной функцией.

    Задание 3 . Найти математическое ожидание случайной величины Х заданной функцией распределения.

    Задание 4 . Плотность вероятности некоторой случайной величины задана следующим образом: f(x) = A/x 4 (x = 1; +∞)
    Найти коэффициент A , функцию распределения F(x) , математическое ожидание и дисперсию, а также вероятность того, что случайная величина примет значение в интервале . Построить графики f(x) и F(x) .

    Задача . Функция распределения некоторой непрерывной случайной величины задана следующим образом:

    Определить параметры a и b , найти выражение для плотности вероятности f(x) , математическое ожидание и дисперсию, а также вероятность того, что случайная величина примет значение в интервале . Построить графики f(x) и F(x).

    Найдем функцию плотности распределения, как производную от функции распределения.
    F′=f(x)=a
    Зная, что найдем параметр a:

    или 3a=1, откуда a = 1/3
    Параметр b найдем из следующих свойств:
    F(4) = a*4 + b = 1
    1/3*4 + b = 1 откуда b = -1/3
    Следовательно, функция распределения имеет вид: F(x) = (x-1)/3

    Математическое ожидание .


    Дисперсия .

    1 / 9 4 3 - (1 / 9 1 3) - (5 / 2) 2 = 3 / 4
    Найдем вероятность того, что случайная величина примет значение в интервале
    P(2 < x< 3) = F(3) – F(2) = (1/3*3 - 1/3) - (1/3*2 - 1/3) = 1/3

    Пример №1 . Задана плотность распределения вероятностей f(x) непрерывной случайной величины X . Требуется:

    1. Определить коэффициент A .
    2. найти функцию распределения F(x) .
    3. схематично построить графики F(x) и f(x) .
    4. найти математическое ожидание и дисперсию X .
    5. найти вероятность того, что X примет значение из интервала (2;3).
    f(x) = A*sqrt(x), 1 ≤ x ≤ 4.
    Решение :

    Случайная величина Х задана плотностью распределения f(x):


    Найдем параметр A из условия:



    или
    14/3*A-1 = 0
    Откуда,
    A = 3 / 14


    Функцию распределения можно найти по формуле.

    Непрерывную с. в. можно задать, используя функцию, которую называют плотностью распределения или плотностью вероятности, или дифференциальной функцией распределения.

    Плотностью распределения вероятностей непрерывной с. в. Х называют функцию f(x) – первую производную от функции распределения F(x):

    Из этого определения следует, что функция распределения является первообразной для плотности распределения.

    Для описания распределения вероятностей дискретной с. в. плотность распределения не применима.

    Вероятностный смысл плотности распределения.

    Таким образом, предел отношения вероятности того, что непрерывная с. в. примет значение, принадлежащее интервалу (x, x +∆x), к длине этого интервала (при ∆x → 0) равен значению плотности распределения в точке х.

    Функция плотности характеризует каждое значение непрерывной случайной величины в отдельности, а не целый диапазон как это имеет место для функции распределения.

    Вероятность попадания непрерывной с. в. в заданный интервал.

    По формуле Ньютона – Лейбница:

    P{a < X  b}= F(b) – F(a),

    таким образом

    Нахождение функции распределения по известной функции плотности.

    Полагая в предыдущей формуле а = -∞, b = х, и заменив переменную интегрирования х на t имеем:

    F(х) = P{X  х}=P{-∞< X  х},

    следовательно

    Свойства плотности распределения

    Свойство 1. Плотность распределения – неотрицательная функция: f(x)0 (т.к. интегральная функция распределения – неубывающая функция, а плотность распределения ее первая производная).

    Свойство 2:

    Доказательство. Несобственный интеграл
    выражает вероятность события, состоящего в том, что случайная величина примет значение, принадлежащая интервалу (-∞, ∞). Очевидно, такое событие достоверно, следовательно, вероятность его равна единице.

    Геометрически это означает, что вся площадь криволинейной трапеции, ограниченной осью 0х и кривой распределения, равна единице.

    Вчастности, если все возможные значения случайной величины принадлежат интервалу (а,b), то
    .

    Возможный график плотности распределения (пример)

    f 1 (x) – плотность распределения размера выигрыша в 1-й игре

    f 2 (x) – плотность распределения размера выигрыша во 2-ой игре

    Какая игра предпочтительней?

    Числовые характеристики случайных величин. .

    Данные характеристики позволяют решать многие задачи, не зная закона распределения случайных величин.

    Характеристики положения случайной величины на числовой оси.

      Математическое ожидание это есть среднее взвешенное значений случайной величины Х, в которое абсцисса каждой точки х i входит с «весом», равным соответствующей вероятности.

    Математическое ожидание иногда называют просто средним значением с.в.

    Обозначение: m x или M [X].

    Для дискретной случайной величины

    M [X] =

    Для непрерывной случайной величины

      Мода – это наиболее вероятное значение случайной величины (то для которого вероятность p i , или плотность распределения f(x) достигает максимума).

    Обозначение: 

    Различают унимодальные распределения (имеют одну моду), полимодальные распределения (имеют несколько мод) и анимодальные (не имеют моды)

    унимодальное

      Медиана – это такое значение случайной величины х m , для которого выполняется следующее равенство:

    P{X < х m }= P{X > х m }

    Медиана делит площадь,ограниченную f(x), пополам

    Если плотность распределения случайной величины симметрична и унимодальна, то М[X],  и х m совпадают

    М[X], , х m – неслучайные величины

    Результат любого случайного эксперимента можно характеризовать качественно и количественно. Качественный результат случайного эксперимента - случайное событие . Любая количественная характеристика , которая в результате случайного эксперимента может принять одно из некоторого множества значений, - случайная величина. Случайная величина является одним из центральных понятий теории вероятностей.

    Пусть - произвольное вероятностное пространство. Случайной величиной называется действительная числовая функция x =x (w ), w W , такая, что при любом действительном x .

    Событие принято записывать в виде x < x . В дальнейшем случайные величины будем обозначать строчными греческими буквами x , h , z , …

    Случайной величиной является число очков, выпавших при бросании игральной кости, или рост случайно выбранного из учебной группы студента. В первом случае мы имеем дело с дискретной случайной величиной (она принимает значения из дискретного числового множества M= {1, 2, 3, 4, 5, 6} ; во втором случае - с непрерывной случайной величиной (она принимает значения из непрерывного числового множества - из промежутка числовой прямой I =).

    Каждая случайная величина полностью определяется своей функцией распределения .

    Если x .- случайная величина, то функция F (x ) = F x (x ) = P (x < x ) называется функцией распределения случайной величины x . Здесь P (x < x ) - вероятность того, что случайная величина x принимает значение, меньшее x .

    Важно понимать, что функция распределения является “паспортом” случайной величины: она содержит всю информация о случайной величине и поэтому изучение случайной величины заключается в исследовании ее функции распределения, которую часто называют просто распределением .

    Функция распределения любой случайной величины обладает следующими свойствами:

    Если x - дискретная случайная величина, принимающая значения x 1 < x 2 < … < x i < … с вероятностями p 1 < p 2 < … < p i < …, то таблица вида

    x 1 x 2 x i
    p 1 p 2 p i

    называется распределением дискретной случайной величины .

    Функция распределения случайной величины, с таким распределением, имеет вид

    У дискретной случайной величины функция распределения ступенчатая. Например, для случайного числа очков, выпавших при одном бросании игральной кости, распределение, функция распределения и график функции распределения имеют вид:

    1 2 3 4 5 6
    1/6 1/6 1/6 1/6 1/6 1/6

    Если функция распределения F x (x ) непрерывна, то случайная величина x называется непрерывной случайной величиной.

    Если функция распределения непрерывной случайной величины дифференцируема , то более наглядное представление о случайной величине дает плотность вероятности случайной величины p x (x ), которая связана с функцией распределения F x (x ) формулами

    и .

    Отсюда, в частности, следует, что для любой случайной величины .

    При решении практических задач часто требуется найти значение x , при котором функция распределения F x (x ) случайной величины x принимает заданное значение p , т.е. требуется решить уравнение F x (x ) = p . Решения такого уравнения (соответствующие значения x ) в теории вероятностей называются квантилями.

    Квантилью x p (p -квантилью, квантилью уровня p ) случайной величины , имеющей функцию распределения F x (x ), называют решение x p уравнения F x (x ) = p , p (0, 1). Для некоторых p уравнение F x (x ) = p может иметь несколько решений, для некоторых - ни одного. Это означает, что для соответствующей случайной величины некоторые квантили определены неоднозначно, а некоторые кванитили не существуют.

    Свойства плотности распределения

    Для начала напомним, что такое плотность распределения:

    Рассмотрим свойства плотности распределения:

    Свойство 1: Функция $\varphi (x)$ плотности распределения неотрицательна:

    Доказательство.

    Мы знаем, что функция распределения $F(x)$ - неубывающая функция. Из определения следует, что $\varphi \left(x\right)=F"(x)$, а производная неубывающей функции -- есть функция неотрицательная.

    Геометрически это свойство означает, то график функции $\varphi \left(x\right)$ плотности распределения находится либо выше, либо на самой оси $Ox$ (рис. 1)

    Рисунок 1. Иллюстрация неравенства $\varphi (x)\ge 0$.

    Свойство 2: Несобственный интеграл от функции плотности распределения пределах от $-\infty $ до $+\infty $ равен 1:

    Доказательство.

    Вспомним формулу для нахождения вероятности того, что случайная величина попадет интервал $(\alpha ,\beta)$:

    Рисунок 2.

    Найдем вероятность того, что случайная величина попадет в интервал $(-\infty ,+\infty $):

    Рисунок 3.

    Очевидно, что случайная величина всегда попадет в интервал $(-\infty ,+\infty $), следовательно, вероятность такого попадания равна единице. Получаем:

    Геометрически, второе свойство означает, что площадь криволинейной трапеции, ограниченной графиком функции плотности распределения $\varphi (x)$ и осью абсцисс численно равна единице.

    Можно также сформулировать обратное свойство:

    Свойство 3: Любая неотрицательная функция $f(x)\ge 0$, удовлетворяющая равенству $\int\limits^{+\infty }_{-\infty }{f\left(x\right)dx}=1$ является функцией плотность распределения некоторой непрерывной случайной величины.

    Вероятностный смысл плотности распределения

    Придадим переменной $x$ приращение $\triangle x$.

    Вероятностный смысл плотности распределения: Вероятность того, что непрерывная случайная величина $X$ примет значения из интервала$(x,x+\triangle x)$, приближенно равна произведению плотности распределения вероятности в точке $x$ на приращение $\triangle x$:

    Рисунок 4. Геометрическая иллюстрация вероятностного смысла плотности распределения непрерывной случайной величины.

    Примеры решения задач с использованием свойств плотности распределения

    Пример 1

    Функция плотности распределения вероятности имеет вид:

    Рисунок 5.

    1. Найти коэффициент $\alpha $.
    2. Построить график плотности распределения.
    1. Рассмотрим несобственный интеграл $\int\limits^{+\infty }_{-\infty }{\varphi \left(x\right)dx}$, получаем:

    Рисунок 6.

    Используя свойство 2, получим:

    \[-2\alpha =1,\] \[\alpha =-\frac{1}{2}.\]

    То есть, функция плотности распределения имеет вид:

    Рисунок 7.

    1. Построим её график:

    Рисунок 8.

    Пример 2

    Функция плотности распределения имеет вид $\varphi \left(x\right)=\frac{\alpha }{chx}$

    (Напомним, что $chx$ -- гиперболический косинус).

    Найти значение коэффициента $\alpha $.

    Решение. Используем второе свойство:

    \[\int\limits^{+\infty }_{-\infty }{\frac{\alpha }{chx}dx}=1,\] \[\alpha \int\limits^{+\infty }_{-\infty }{\frac{dx}{chx}}=1,\] \[\int\limits^{+\infty }_{-\infty }{\frac{dx}{chx}}={\mathop{lim}_{a\to -\infty } \int\limits^0_a{\frac{dx}{chx}}\ }+{\mathop{lim}_{b\to +\infty } \int\limits^b_0{\frac{dx}{chx}}\ }\]

    Так как $chx=\frac{e^x+e^{-x}}{2}$, то

    \[\int{\frac{dx}{chx}}=2\int{\frac{dx}{e^x+e^{-x}}}=2\int{\frac{de^x}{{1+e}^{2x}}}=2arctge^x+C\]

    \[\int\limits^{+\infty }_{-\infty }{\frac{dx}{chx}}={\mathop{lim}_{a\to -\infty } \left(-2arctge^a\right)\ }+{\mathop{lim}_{b\to +\infty } \left(2arctge^b\right)\ }=\pi \]

    Следовательно:

    \[\pi \alpha =1,\] \[\alpha =\frac{1}{\pi }\]