Нормальный закон распределения вероятностей имеет. Нормальный закон распределения непрерывной случайной величины

Примерами случайных величин, распределённых по нормальному закону, являются рост человека, масса вылавливаемой рыбы одного вида . Нормальность распределения означает следующее : существуют значения роста человека, массы рыбы одного вида, которые на интуитивном уровне воспринимаются как "нормальные" (а по сути - усреднённые), и они-то в достаточно большой выборке встречаются гораздо чаще, чем отличающиеся в бОльшую или меньшую сторону.

Нормальное распределение вероятностей непрерывной случайной величины (иногда - распределение Гаусса) можно назвать колоколообразным из-за того, что симметричная относительно среднего функция плотности этого распределения очень похожа на разрез колокола (красная кривая на рисунке выше).

Вероятность встретить в выборке те или иные значение равна площади фигуры под кривой и в случае нормального распределения мы видим, что под верхом "колокола", которому соответствуют значения, стремящиеся к среднему, площадь, а значит, вероятность, больше, чем под краями. Таким образом, получаем то же, что уже сказано: вероятность встретить человека "нормального" роста, поймать рыбу "нормальной" массы выше, чем для значений, отличающихся в бОльшую или меньшую сторону. В очень многих случаях практики ошибки измерения распределяются по закону, близкому к нормальному.

Остановимся ещё раз на рисунке в начале урока, на котором представлена функция плотности нормального распределения. График этой функции получен при рассчёте некоторой выборки данных в пакете программных средств STATISTICA . На ней столбцы гистограммы представляют собой интервалы значений выборки, распределение которых близко (или, как принято говорить в статистике, незначимо отличаются от) к собственно графику функции плотности нормального распределения, который представляет собой кривую красного цвета. На графике видно, что эта кривая действительно колоколообразная.

Нормальное распределение во многом ценно благодаря тому, что зная только математическое ожидание непрерывной случайной величины и стандартное отклонение, можно вычислить любую вероятность, связанную с этой величиной.

Нормальное распределение имеет ещё и то преимущество, что один из наиболее простых в использовании статистических критериев, используемых для проверки статистических гипотез - критерий Стьюдента - может быть использован только в том случае, когда данные выборки подчиняются нормальному закону распределения.

Функцию плотности нормального распределения непрерывной случайной величины можно найти по формуле:

,

где x - значение изменяющейся величины, - среднее значение, - стандартное отклонение, e =2,71828... - основание натурального логарифма, =3,1416...

Свойства функции плотности нормального распределения

Изменения среднего значения перемещают кривую функции плотности нормального распределения в направлении оси Ox . Если возрастает, кривая перемещается вправо, если уменьшается, то влево.

Если меняется стандартное отклонение, то меняется высота вершины кривой. При увеличении стандартного отклонения вершина кривой находится выше, при уменьшении - ниже.

Вероятность попадания значения нормально распределённой случайной величины в заданный интервал

Уже в этом параграфе начнём решать практические задачи, смысл которых обозначен в заголовке. Разберём, какие возможности для решения задач предоставляет теория. Отправное понятие для вычисления вероятности попадания нормально распределённой случайной величины в заданный интервал - интегральная функция нормального распределения.

Интегральная функция нормального распределения :

.

Однако проблематично получить таблицы для каждой возможной комбинации среднего и стандартного отклонения. Поэтому одним из простых способов вычисления вероятности попадания нормально распределённой случайной величины в заданный интервал является использование таблиц вероятностей для стандартизированного нормального распределения.

Стандартизованным или нормированным называется нормальное распределение , среднее значение которого , а стандартное отклонение .

Функция плотности стандартизованного нормального распределения :

.

Интегральная функция стандартизованного нормального распределения :

.

На рисунке ниже представлена интегральная функция стандартизованного нормального распределения, график которой получен при рассчёте некоторой выборки данных в пакете программных средств STATISTICA . Собственно график представляет собой кривую красного цвета, а значения выборки приближаются к нему.


Для увеличения рисунка можно щёлкнуть по нему левой кнопкой мыши.

Стандартизация случайной величины означает переход от первоначальных единиц, используемых в задании, к стандартизованным единицам. Стандартизация выполняется по формуле

На практике все возможные значения случайной величины часто не известны, поэтому значения среднего и стандартного отклонения точно определить нельзя. Их заменяют средним арифметическим наблюдений и стандартным отклонением s . Величина z выражает отклонения значений случайной величины от среднего арифметического при измерении стандартных отклонений.

Открытый интервал

Таблица вероятностей для стандартизированного нормального распределения, которая есть практически в любой книге по статистике, содержит вероятности того, что имеющая стандартное нормальное распределение случайная величина Z примет значение меньше некоторого числа z . То есть попадёт в открытый интервал от минус бесконечности до z . Например, вероятность того, что величина Z меньше 1,5, равна 0,93319.

Пример 1. Предприятие производит детали, срок службы которых нормально распределён со средним значением 1000 и стандартным отклонением 200 часов.

Для случайно отобранной детали вычислить вероятность того, что её срок службы будет не менее 900 часов.

Решение. Введём первое обозначение:

Искомая вероятность.

Значения случайной величины находятся в открытом интервале. Но мы умеем вычислять вероятность того, что случайная величина примет значение, меньшее заданного, а по условию задачи требуется найти равное или большее заданного. Это другая часть пространства под кривой плотности нормального распределения (колокола). Поэтому, чтобы найти искомую вероятность, нужно из единицы вычесть упомянутую вероятность того, что случайная величина примет значение, меньше заданного 900:

Теперь случайную величину нужно стандартизировать.

Продолжаем вводить обозначения:

z = (X ≤ 900) ;

x = 900 - заданное значение случайной величины;

μ = 1000 - среднее значение;

σ = 200 - стандартное отклонение.

По этим данным условия задачи получаем:

.

По таблицам стандартизированной случайной величине (границе интервала) z = −0,5 соответствует вероятность 0,30854. Вычтем ее из единицы и получим то, что требуется в условии задачи:

Итак, вероятность того, что срок службы детали будет не менее 900 часов, составляет 69%.

Эту вероятность можно получить, используя функцию MS Excel НОРМ.РАСП (значение интегральной величины - 1):

P (X ≥900) = 1 - P (X ≤900) = 1 - НОРМ.РАСП(900; 1000; 200; 1) = 1 - 0,3085 = 0,6915.

О расчётах в MS Excel - в одном из последующих параграфах этого урока.

Пример 2. В некотором городе среднегодовой доход семьи является нормально распределённой случайной величиной со средним значением 300000 и стандартным отклонением 50000. Известно, что доходы 40 % семей меньше величины A . Найти величину A .

Решение. В этой задаче 40 % - ни что иное, как вероятность того, что случайная величина примет значение из открытого интервала, меньшее определённого значения, обозначенного буквой A .

Чтобы найти величину A , сначала составим интегральную функцию:

По условию задачи

μ = 300000 - среднее значение;

σ = 50000 - стандартное отклонение;

x = A - величина, которую нужно найти.

Составляем равенство

.

По статистическим таблицам находим, что вероятность 0,40 соответствует значению границы интервала z = −0,25 .

Поэтому составляем равенство

и находим его решение:

A = 287300 .

Ответ: доходы 40 % семей менее 287300.

Закрытый интервал

Во многих задачах требуется найти вероятность того, что нормально распределённая случайная величина примет значение в интервале от z 1 до z 2 . То есть попадёт в закрытый интервал. Для решения таких задач необходимо найти в таблице вероятности, соответствующие границам интервала, а затем найти разность этих вероятностей. При этом требуется вычитать меньшее значение из большего. Примеры на решения этих распространённых задач - следующие, причём решить их предлагается самостоятельно, а затем можно посмотреть правильные решения и ответы.

Пример 3. Прибыль предприятия за некоторый период - случайная величина, подчинённая нормальному закону распределения со средним значением 0,5 млн. у.е. и стандартным отклонением 0,354. Определить с точностью до двух знаков после запятой вероятность того, что прибыль предприятия составит от 0,4 до 0,6 у.е.

Пример 4. Длина изготавливаемой детали представляет собой случайную величину, распределённую по нормальному закону с параметрами μ =10 и σ =0,071 . Найти с точностью до двух знаков после запятой вероятность брака, если допустимые размеры детали должны быть 10±0,05 .

Подсказка: в этой задаче помимо нахождения вероятности попадания случайной величины в закрытый интервал (вероятность получения небракованной детали) требуется выполнить ещё одно действие.

позволяет определить вероятность того, что стандартизованное значение Z не меньше -z и не больше +z , где z - произвольно выбранное значение стандартизованной случайной величины.

Приближенный метод проверки нормальности распределения

Приближенный метод проверки нормальности распределения значений выборки основан на следующем свойстве нормального распределения: коэффициент асимметрии β 1 и коэффициент эксцесса β 2 равны нулю .

Коэффициент асимметрии β 1 численно характеризует симметрию эмпирического распределения относительно среднего. Если коэффициент асимметрии равен нулю, то среднее арифметрического значение, медиана и мода равны: и кривая плотности распределения симметрична относительно среднего. Если коэффициент асимметрии меньше нуля (β 1 < 0 ), то среднее арифметическое меньше медианы, а медиана, в свою очередь, меньше моды () и кривая сдвинута вправо (по сравнению с нормальным распределением) . Если коэффициент асимметрии больше нуля (β 1 > 0 ), то среднее арифметическое больше медианы, а медиана, в свою очередь, больше моды () и кривая сдвинута влево (по сравнению с нормальным распределением) .

Коэффициент эксцесса β 2 характеризует концентрацию эмпирического распределения вокруг арифметического среднего в направлении оси Oy и степень островершинности кривой плотности распределения. Если коэффициент эксцесса больше нуля, то кривая более вытянута (по сравнению с нормальным распределением) вдоль оси Oy (график более островершинный). Если коэффициент эксцесса меньше нуля, то кривая более сплющена (по сравнению с нормальным распределением) вдоль оси Oy (график более туповершинный).

Коэффициент асимметрии можно вычислить с помощью функции MS Excel СКОС. Если вы проверяете один массив данных, то требуется ввести диапазон данных в одно окошко "Число".


Коэффициент эксцесса можно вычислить с помощью функции MS Excel ЭКСЦЕСС. При проверке одного массива данных также достаточно ввести диапазон данных в одно окошко "Число".


Итак, как мы уже знаем, при нормальном распределении коэффициенты асимметрии и эксцесса равны нулю. Но что, если мы получили коэффициенты асимметрии, равные -0,14, 0,22, 0,43, а коэффициенты эксцесса, равные 0,17, -0,31, 0,55? Вопрос вполне справедливый, так как практически мы имеем дело лишь с приближенными, выборочными значениями асимметрии и эксцесса, которые подвержены некоторому неизбежному, неконтролируемому разбросу. Поэтому нельзя требовать строгого равенства этих коэффициентов нулю, они должны лишь быть достаточно близкими к нулю. Но что значит - достаточно?

Требуется сравнить полученные эмпирические значения с допустимыми значениями. Для этого нужно проверить следующие неравенства (сравнить значения коэффициентов по модулю с критическими значениями - границами области проверки гипотезы).

Для коэффициента асимметрии β 1 .

Краткая теория

Нормальным называют распределение вероятностей непрерывной случайной величины , плотность которого имеет вид:

где – математическое ожидание , – среднее квадратическое отклонение .

Вероятность того, что примет значение, принадлежащее интервалу :

где – функция Лапласа :

Вероятность того, что абсолютная величина отклонения меньше положительного числа :

В частности, при справедливо равенство:

При решении задач, которые выдвигает практика, приходится сталкиваться с различными распределениями непрерывных случайных величин .

Кроме нормального распределения, основные законы распределения непрерывных случайных величин:

Пример решения задачи

На станке изготавливается деталь. Ее длина - случайная величина, распределенная по нормальному закону с параметрами , . Найти вероятность того, что длина детали будет заключена между 22 и 24,2 см. Какое отклонение длины детали от можно гарантировать с вероятностью 0,92; 0,98? В каких пределах, симметричных относительно , будут лежать практически все размеры деталей?

Решение:

Вероятность того, что случайная величина, распределенная по нормальному закону, будет находиться в интервале :

Получаем:

Вероятность того, что случайная величина, распределенная по нормальному закону, отклонится от среднего не более чем на величину .

Определение. Нормальным называется распределение вероятностей непрерывной случайной величины, которое описывается плотностью вероятности

Нормальный закон распределения также называется законом Гаусса .

Нормальный закон распределения занимает центральное место в теории вероятностей. Это обусловлено тем, что этот закон проявляется во всех случаях, когда случайная величина является результатом действия большого числа различных факторов. К нормальному закону приближаются все остальные законы распределения.

Можно легко показать, что параметры и , входящие в плотность распределения являются соответственно математическим ожиданием и средним квадратическим отклонением случайной величины Х.

Найдем функцию распределения F(x) .

График плотности нормального распределения называется нормальной кривой или кривой Гаусса .

Нормальная кривая обладает следующими свойствами:

1) Функция определена на всей числовой оси.

2) При всех х функция распределения принимает только положительные значения.

3) Ось ОХ является горизонтальной асимптотой графика плотности вероятности, т.к. при неограниченном возрастании по абсолютной величине аргумента х , значение функции стремится к нулю.

4) Найдем экстремум функции.

Т.к. при y’ > 0 при x < m и y’ < 0 при x > m , то в точке х = т функция имеет максимум, равный .

5) Функция является симметричной относительно прямой х = а , т.к. разность

(х – а ) входит в функцию плотности распределения в квадрате.

6) Для нахождения точек перегиба графика найдем вторую производную функции плотности.

При x = m + s и x = m - s вторая производная равна нулю, а при переходе через эти точки меняет знак, т.е. в этих точках функция имеет перегиб.

В этих точках значение функции равно .

Построим график функции плотности распределения.

Построены графики при т =0 и трех возможных значениях среднего квадратичного отклонения s = 1, s = 2 и s = 7. Как видно, при увеличении значения среднего квадратичного отклонения график становится более пологим, а максимальное значение уменьшается..

Если а > 0, то график сместится в положительном направлении, если а < 0 – в отрицательном.

При а = 0 и s = 1 кривая называется нормированной . Уравнение нормированной кривой:

Для краткости говорят, что СВ Х подчиняется закону N(m, s), т.е. Х ~ N(m, s). Параметры m и s совпадают с основными характеристиками распределения: m = m X , s = s Х = . Если СВ Х ~ N(0, 1), то она называется стандартизованной нормальной величиной . ФР стандартизованной нормальной величиной называется функцией Лапласа и обозначается как Ф(x) . С ее помощью можно вычислять интервальные вероятности для нормального распределения N(m, s):

P(x 1 £ X < x 2) = Ф - Ф .

При решении задач на нормальное распределение часто требуется использовать табличные значения функции Лапласа. Поскольку для функции Лапласа справедливо соотношение Ф(-х) = 1 - Ф(х) , то достаточно иметь табличные значения функции Ф(х) только для положительных значений аргумента.

Для вероятности попадания на симметричный относительно математического ожидания интервал справедлива формула: P(|X - m X | < e) = 2×Ф(e/s) - 1.

Центральные моменты нормального распределения удовлетворяют рекуррентному соотношению: m n +2 = (n+1)s 2 m n , n = 1, 2, ... . Отсюда следует, что все центральные моменты нечетного порядка равны нулю (так как m 1 = 0).

Найдем вероятность попадания случайной величины, распределенной по нормальному закону, в заданный интервал.

Обозначим

Т.к. интеграл не выражается через элементарные функции, то вводится в рассмотрение функция

,

которая называется функцией Лапласа или интегралом вероятностей .

Значения этой функции при различных значениях х посчитаны и приводятся в специальных таблицах.

Ниже показан график функции Лапласа.

Функция Лапласа обладает следующими свойствами:

2) Ф(-х ) = - Ф(х );

Функцию Лапласа также называют функцией ошибок и обозначают erf x .

Еще используется нормированная функция Лапласа, которая связана с функцией Лапласа соотношением:

Ниже показан график нормированной функции Лапласа.

При рассмотрении нормального закона распределения выделяется важный частный случай, известный как правило трех сигм .

Запишем вероятность того, что отклонение нормально распределенной случайной величины от математического ожидания меньше заданной величины D:

Если принять D = 3s, то получаем с использованием таблиц значений функции Лапласа:

Т.е. вероятность того, что случайная величина отклонится от своего математического ожидание на величину, большую чем утроенное среднее квадратичное отклонение, практически равна нулю.

Это правило называется правилом трех сигм .

Не практике считается, что если для какой – либо случайной величины выполняется правило трех сигм, то эта случайная величина имеет нормальное распределение.

Пример. Поезд состоит из 100 вагонов. Масса каждого вагона – случайная величина, распределенная по нормальному закону с математическим ожидание а = 65 т и средним квадратичным отклонением s = 0,9 т. Локомотив может везти состав массой не более 6600 т, в противном случае необходимо прицеплять второй локомотив. Найти вероятность того, что второй локомотив не потребуется.

Второй локомотив не потребуется, если отклонение массы состава от ожидаемого (100×65 = 6500) не превосходит 6600 – 6500 = 100 т.

Т.к. масса каждого вагона имеет нормальное распределение, то и масса всего состава тоже будет распределена нормально.

Получаем:

Пример. Нормально распределенная случайная величина Х задана своими параметрами – а =2 – математическое ожидание и s = 1 – среднее квадратическое отклонение. Требуется написать плотность вероятности и построить ее график, найти вероятность того, Х примет значение из интервала (1; 3), найти вероятность того, что Х отклонится (по модулю) от математического ожидания не более чем на 2.

Плотность распределения имеет вид:

Построим график:

Найдем вероятность попадания случайной величины в интервал (1; 3).

Найдем вероятность отклонение случайной величины от математического ожидания на величину, не большую чем 2.

Тот же результат может быть получен с использованием нормированной функции Лапласа.

Лекция 8 Закон больших чисел (Раздел 2)

План лекции

Центральная предельная теорема (общая формулировка и частная формулировка для независимых одинаково распределенных случайных величин).

Неравенство Чебышева.

Закон больших чисел в форме Чебышева.

Понятие частоты события.

Статистическое понимание вероятности.

Закон больших чисел в форме Бернулли.

Изучение статистических закономерностей позволило установить, что при некоторых условиях суммарное поведение большого количества случайных величин почти утрачивает случайный характер и становится закономерным (иначе говоря, случайные отклонения от некоторого среднего поведения взаимно погашаются). В частности, если влияние на сумму отдельных слагаемых является равномерно малым, закон распределения суммы приближается к нормальному. Математическая формулировка этого утверждения дается в группе теорем, называемой законом больших чисел .

ЗАКОН БОЛЬШИХ ЧИСЕЛ – общий принцип, в силу которого совместное действие случайных факторов приводит при некоторых весьма общих условиях к результату, почти не зависящему от случая. Первым примером действия этого принципа может служить сближение частоты наступления случайного события с его вероятностью при возрастании числа испытаний (часто использующееся на практике, например, при использовании частоты встречаемости какого-либо качества респондента в выборке как выборочной оценки соответствующей вероятности).

Сущность закона больших чисел состоит в том, что при большом числе независимых опытов частота появления какого-то события близка к его вероятности.

Центральная предельная теорема (ЦПТ) (в формулировке Ляпунова А.М. для одинаково распределенных СВ). Если попарно независимые СВ X 1 , X 2 , ..., X n , ... имеют одинаковый закон распределения с конечными числовыми характеристиками M = m и D = s 2 , то при n ® ¥ закон распределения СВ неограниченно приближается к нормальному закону N(n×m, ).

Следствие. Если в условии теоремы СВ , то при n ® ¥ закон распределения СВ Y неограниченно приближается к нормальному закону N(m, s/ ).

Теорема Муавра-Лапласа. Пусть СВ К - число “успехов” в n испытаниях по схеме Бернулли. Тогда при n ® ¥ и фиксированном значении вероятности “успеха” в одном испытании p закон распределения СВ K неограниченно приближается к нормальному закону N(n×p, ).

Следствие. Если в условии теоремы вместо СВ К рассмотреть СВ К/n - частоту “успехов” в n испытаниях по схеме Бернулли, то ее закон распределения при n ® ¥ и фиксированном значении p неограниченно приближается к нормальному закону N(p, ).

Замечание. Пусть СВ К - число “успехов” в n испытаниях по схеме Бернулли. Законом распределения такой СВ является биноминальный закон. Тогда при n ® ¥ биноминальный закон имеет два предельных распределения:

n распределение Пуассона (при n ® ¥ и l = n×p = const);

n распределение Гаусса N(n×p, ) (при n ® ¥ и p = const).

Пример. Вероятность “успеха” в одном испытании всего лишь p = 0,8. Сколько нужно провести испытаний, чтобы с вероятностью не менее 0,9 можно ожидать, что наблюдаемая частота “успеха” в испытаниях по схеме Бернулли отклонится от вероятности p не более чем на e = 0,01?

Решение. Для сравнения решим задачу двумя способами.

Нормальное распределение (normal distribution ) - играет важную роль в анализе данных.

Иногда вместо термина нормальное распределение употребляют термин гауссовское распределение в честь К. Гаусса (более старые термины, практически не употребляемые в настоящее время: закон Гаусса, Гаусса-Лапласа распределение).

Одномерное нормальное распределение

Нормальное распределение имеет плотность::

В этой формуле , фиксированные параметры, - среднее , - стандартное отклонение .

Графики плотности при различных параметрах приведены .

Характеристическая функция нормального распределения имеет вид:

Дифференцируя характеристическую функцию и полагая t = 0 , получаем моменты любого порядка.

Кривая плотности нормального распределения симметрична относительно и имеет в этой точке единственный максимум, равный

Параметр стандартного отклонения меняется в пределах от 0 до ∞.

Среднее меняется в пределах от -∞ до +∞.

При увеличении параметра кривая растекается вдоль оси х , при стремлении к 0 сжимается вокруг среднего значения (параметр характеризует разброс, рассеяние).

При изменении кривая сдвигается вдоль оси х (см. графики).

Варьируя параметры и , мы получаем разнообразные модели случайных величин, возникающие в телефонии.

Типичное применение нормального закона в анализе, например, телекоммуникационных данных - моделирование сигналов, описание шумов, помех, ошибок, трафика.

Графики одномерного нормального распределения

Рисунок 1. График плотности нормального распределения: среднее равно 0, стандартное отклонение 1

Рисунок 2. График плотности стандартного нормального распределения с областями, содержащими 68% и 95% всех наблюдений

Рисунок 3. Графики плотностей нормальных распределений c нулевым средним и разными отклонениями (=0.5, =1, =2)

Рисунок 4 Графики двух нормальных распределений N(-2,2) и N(3,2).

Заметьте, центр распределения сдвинулся при изменении параметра .

Замечание

В программе STATISTICA под обозначением N(3,2) понимается нормальный или гауссов закон с параметрами: среднее = 3 и стандартное отклонение =2.

В литературе иногда второй параметр трактуется как дисперсия , т.е. квадрат стандартного отклонения.

Вычисления процентных точек нормального распределения с помощью вероятностного калькулятора STATISTICA

С помощью вероятностного калькулятора STATISTICA можно вычислить различные характеристики распределений, не прибегая к громоздким таблицам, используемым в старых книгах.

Шаг 1. Запускаем Анализ / Вероятностный калькулятор / Распределения .

В разделе распределения выберем нормальное .

Рисунок 5. Запуск калькулятора вероятностных распределений

Шаг 2. Указываем интересующие нас параметры.

Например, мы хотим вычислить 95% квантиль нормального распределения со средним 0 и стандартным отклонением 1.

Укажем эти параметры в полях калькулятора (см. поля калькулятора среднее и стандартное отклонение).

Введем параметр p=0,95.

Галочка «Обратная ф.р». отобразится автоматически. Поставим галочку «График».

Нажмем кнопку «Вычислить» в правом верхнем углу.

Рисунок 6. Настройка параметров

Шаг 3. В поле Z получаем результат: значение квантиля равно 1,64 (см. следующее окно).

Рисунок 7. Просмотр результата работы калькулятора

Рисунок 8. Графики плотности и функции распределения. Прямая x=1,644485

Рисунок 9. Графики функции нормального распределения. Вертикальные пунктирные прямые- x=-1.5, x=-1, x=-0.5, x=0

Рисунок 10. Графики функции нормального распределения. Вертикальные пунктирные прямые- x=0.5, x=1, x=1.5, x=2

Оценка параметров нормального распределения

Значения нормального распределения можно вычислить с помощью интерактивного калькулятора .

Двумерное нормальное распределение

Одномерное нормальное распределение естественно обобщается на двумерное нормальное распределение.

Например, если вы рассматриваете сигнал только в одной точке, то вам достаточно одномерного распределения, в двух точках - двумерного, в трех точках - трехмерного и т.д.

Общая формула для двумерного нормального распределения имеет вид:

Где - парная корреляция между X 1 и X 2 ;

X 1 соответственно;

Среднее и стандартное отклонение переменной X 2 соответственно.

Если случайные величины Х 1 и Х 2 независимы, то корреляция равна 0, = 0, соответственно средний член в экспоненте зануляется, и мы имеем:

f(x 1 ,x 2) = f(x 1)*f(x 2)

Для независимых величин двумерная плотность распадается в произведение двух одномерных плотностей.

Графики плотности двумерного нормального распределения

Рисунок 11. График плотности двумерного нормального распределения (нулевой вектор средних, единичная ковариационная матрица)

Рисунок 12. Сечение графика плотности двумерного нормального распределения плоскостью z=0.05

Рисунок 13. График плотности двумерного нормального распределения (нулевой вектор мат. ожидания, ковариационная матрица с 1 на главной диагонали и 0.5 на побочной)

Рисунок 14. Сечение графика плотности двумерного нормального распределения (нулевой вектор мат. ожидания, ковариационная матрица с 1 на главной диагонали и 0.5 на побочной) плоскостью z= 0.05

Рисунок 15. График плотности двумерного нормального распределения (нулевой вектор мат. ожидания, ковариационная матрица с 1 на главной диагонали и -0.5 на побочной)

Рисунок 16. Сечение графика плотности двумерного нормального распределения (нулевой вектор мат. ожидания, ковариационная матрица с 1 на главной диагонали и -0.5 на побочной) плоскостью z=0.05

Рисунок 17. Сечения графиков плотностей двумерного нормального распределения плоскостью z=0.05

Для лучшего понимания двумерного нормального распределения попробуйте решить следующую задачу.

Задача. Посмотрите на график двумерного нормального распределения. Подумайте, можно ли его представить, как вращение графика одномерного нормального распределения? Когда нужно применить прием деформации?

Случайная величина называется распределенной по нормальному (Гауссовскому) закону с параметрами аи () , если плотность распределения вероятностей имеет вид

Величина, распределенная по нормальному закону, всегда имеет бесчисленное множество возможных значений, поэтому ее удобно изображать графически, с помощью графика плотности распределения. Согласно формуле

вероятность того, что случайная величина примет значение из интервала равна площади под графиком функции на этом интервале (геометрический смысл определенного интеграла). Рассматриваемая функция неотрицательна и непрерывна. График функ­ции имеет вид колокола и называется кривой Гаусса или нормальной кривой.

На рисунке изображено несколько кривых плотности распределения случайной величины, заданной по нормальному закону.

Все кривые имеют одну точку максимума, при удалении от которой вправо и влево кривые убывают. Максимум достигается при и равен .

Кривые симметричны относительно вертикальной прямой, проведенной через наивысшую точку. Площадь подграфика каждой кривой равна 1.

Различие отдельных кривых распределения состоит лишь в том, что суммарная площадь подграфика, одна и та же для всех кривых, различным образом распределена между различными участками. Основная часть площади подграфика любой кривой сосредоточена в непосредственной близости наивероятнейшего значения , а это значение у всех трех кривых разное. При различных значениях и а получаются различные нормальные законы и различные графики плотности функции распределения.

Теоретические исследования показали, что большинство встречающихся на практике случайных величин имеет нормальный закон распределения. По этому закону распределяется скорость газовых молекул, вес новорожденных, размер одежды и обуви населения страны и много других случайных событий физической и биологической природы. Впервые эту закономерность заметил и теоретически обосновал А. Муавр.

При , функция совпадает с функцией , о которой уже шла речь в локальной предельной теореме Муавра–Лапласа. Плотность вероятности нормального распределения легко выражаетсячерез :

При таких значениях параметров нормальный закон называется основным .

Функция распределения для нормированной плотности называется функцией Лапласа и обозначается Φ(х) . Мы также уже встречались с этой функцией.

Функция Лапласа не зависит от конкретных параметров а и σ. Для функции Лапласа, с помощью методов приближенного интегрирования составлены таблицы значений на проме­жутке с разной степенью точности. Очевидно, что функция Лапласа является нечетной, следовательно, нет необходимости помещать в таблицу ее значения при отрицательных .



Для случайной величины, распределенной по нормальному закону с параметрами а и , математическое ожидание и дисперсия вычисляются по формулам: , .Среднее квадратическое отклонение равно .

Вероятность того, что нормально распределенная величина примет значение из интервала , равна

где есть функция Лапласа, введенная в интегральной предельной теореме.

Часто в задачах требуется вычислить вероятность того, что отклонение нормально распределенной случайной величины X от своего математического ожидания по абсолютной величине не превосходит некоторого значения , т.е. вычислить вероятность . Применяя формулу (19.2), имеем:

В заключение приведем одно важное следствие из формулы (19.3). Положим в этой формуле . Тогда , т.е. вероятность того, что абсолютная величина отклонения X от своего математического ожидания не превысит , равна 99,73%. Практически такое событие можно считать достоверным. В этом и состоит сущность правила трех сигм.

Правило трех сигм. Если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания практически не превосходит утроенного среднего квадратического отклонения.