Показательное распределение. Показательный (экспоненциальный) закон распределения График показательного распределения

Показательным называют распределение непрерывной случайной величины Х которое описывается следующей дифференциальной функцией

Экспоненциальное распределение для непрерывных случайных величин является аналогом распределения Пуассона для дискретных случайных величин и имеет следующий вид.

вероятность попадания случайной величины Х на интервал (α;β)

Следует отметить, что время безотказной работы удовлетворяется именно показательному закону, а поэтому это понятие часто используется в понятии надежности.

Нормальный закон распределения (закон Гаусса)

Нормальным называется распределение случайной величины Х если ф-ция плотности распределения

Полученное выражение через элементарные функции не может быть выражено, такая функция так называемый интеграл вероятности для которой составлены таблицы, чаще всего в качестве такой функции используют

Часто по условию задачи необходимо определить вероятность попадания случайной величины Х на участок симметричный математическому ожиданию.

Правило трех сигм это правило часто используется для подтверждения или отбрасывания гипотезы о нормальном распределении случайной величины.

Мат. статистика

Выборочная сумма:

.

Выборочное среднее:

.

Выборочная дисперсия:

, где т i – частота.

Выборочное СКО:

.

Эмпирическая функция распределения:

F * (x)=P(X

F * (x)= .

Точечные оценки:

Несмещенная оценка генеральной средней (мат.ожидания ):

, х i – варианта выборки, m i – частота варианты х i , - объем выборки.

Смещенная оценка генеральной дисперсии – выборочная дисперсия:

, так как

.

Несмещенной оценкой генеральной дисперсии служит «исправленная дисперсия»:

. При п<30.

Коэффициент вариации:

.

Центральный момент к -го порядка:

.

Начальный момент к -го порядка:

.

Ассиметрия : , т 3 =

Эксцесс : , где т 4 =

Групповая средняя : .

Общая средняя: , где .

Общая дисперсия: .

Интервальные оценки:

Доверительный интервал для мат.ожидания а нормально распределенного количества признака Х :

.

Критерий согласия Пирсона:

Если число наблюдений очень велико, то закон распределения СВ не зависит от того, какому закону подчинена генеральная совокупность. Он приближается к распределению с к степенями свободы, а сам критерий называется критерием согласия Пирсона:

, где к – количество интервалов сгруппированного ряда, т i >0,05n .

Количество степеней свободы : r=k-p-1 , где к – количество интервалов, р – количество параметров закона.



Уровень значимости α :

α=0,05 и α=0,01.

Если , то Н 0 принимается , т.е. предполагаемый закон распределения отвечает эмпирическим данным. При этом мы ошибаемся в 5-ти случаях из 100, принимая возможно ошибочную гипотезу (ошибка 2-го рода).

Если , то Н 0 отвергается , т.е. предполагаемый закон не отвечает эмпирическим данным. При этом мы ошибаемся в 1-ом случае из 100, отбрасывая правильную гипотезу (ошибка 1-го рода).

Если , то имеем неопределенность и можно использовать др. критерии.


Корреляция

- сумма частот в i -ом столбце;

- сумма частот в к -ой строке;

- число пар (х i ; y k) .

Условное среднее : .

Теоретические уравнения линий регрессии :

.

Расчет числовых характеристик:

Показатель тесноты корреляционной связи – эмпирическое корреляционное отношение:

, где .

.

Свойства:

1. 0≤η≤1 .

2. если η =1, то у(х) – связь функциональная.

3. η =0, то связи нет.

4. η≥ .

5. если η = , то имеет место точная линейная корреляционная зависимость.

6. чем ближе η к 0, тем корреляционная связь слабее, чем ближе к 1, тем корреляционная связь сильнее и в пределе она превращается в функциональную зависимость.

Коэффициент корреляции:

.

Проверка значимости параметров корреляционной зависимости:

1. Проверка существенности линейной корреляционной связи (значимости регрессии) .

При больших объемах выборки коэф.корреляции подчиняется нормальному закону. При этом .

2. Проверка значимости регрессии :

.

Если τ р >2,58, то с уверенностью 99% можно утверждать, что корреляционная зависимость существенна (регрессия значима). Т.е. корреляционная связь существует не только в выборке, но и во всей генеральной совокупности.

τ р <1,96, то с уверенностью 95% можно утверждать, что корреляционная зависимость не явл. существенной, т.е. она характерна только для данной выборки и может не существовать в генеральной совокупности.



1,96<τ р < 2,58 – несущественная корреляционная зависимость.

3. Проверка линейности выбранной модели (проверка адекватности):

.

Р=99% (α=0,01): t=2,58

Р=95% (α=0,05): t=1,96

Если величина η у/х удовлетворяет этому неравенству, то выбранная модель адекватна, она соответствует эмпирическим данным.

Критерий Фишера:

, п – число наблюдений, к – число интервалов по Х.

При уровнях значимости:

α=0,05 и α=0,01: F 0,05 (k-1;n-1); F 0,01 (k-1;n-k).

Если F y / x

Проверка значимости регрессии:

, по табл. F 0,01 (1;n-2), F 0,05 (1;n-2).

Если F R >F 0,01 , то регрессия значима, если F R

Адекватность модели по Фишеру:

.

F 0,01 (k-2;n-k), F 0,05 (k-2;n-k).

Если F A >F 0,01 , то модель неадекватна, если F A

Критерий Романовского:

, где r – число ступеней свободы. Если ρ<3 , то расхождение между теоретическими и эмпирическими распределениями нужно считать незначительными.

Критерий согласованности Калмагорова:

- наибольшая по абсолютной величине разность между накопленными частотами эмпирического и теоретического распределения.

к – количество интервалов.

По таблице находим соответствующее значение вероятности Р(λ). Если Р(λ)<0,05, то расхождение между распределениями существенно, оно не может быть вызвано случайными причинами. Чем ближе эта вероятность к 1, тем лучше теоретическое распределение согласовывается с эмпирическим.

Непрерывная случайная величина имеет показательный (экспоненциальный ) закон распределения с параметром , если ее плотность вероятности имеет вид :

(12.1)

Здесь постоянная положительная величина. Т.о. показательное распределение определяется одним положительным параметром . Найдем интегральную функцию показательного распределения:

(12.3)

Рис. 12.1. Дифференциальная функция показательного распределения ()

Рис. 12.2. Интегральная функция показательного распределения ()

Числовые характеристики показательного распределения

Вычислим математическое ожидание и дисперсию показательного распределения:

Для вычисления дисперсии воспользуемся одним из ее свойств:

Т.к. , то остается вычислить :

Подставив (12.6) в (12.5), окончательно получим:

(12.7)

Для случайной величины, распределенной по показательному закону, математическое ожидание равно среднему квадратическому отклонению.

Пример 1. Написать дифференциальную и интегральную функции показательного распределения, если параметр .

Решение . а) Плотность распределения имеет вид:

б) Соответствующая интегральная функция равна:

Пример 2. Найти вероятность попадания в заданный интервал для СВ , распределенной по экспоненциальному закону

Решение . Найдем решение, вспомнив, что: . Теперь с учетом (12.3) получим:

Функция надежности

Будем называть элементом некоторое устройство, независимо от того "простое" оно или "сложное". Пусть элемент начинает работать в момент времени , а по истечении времени длительностью происходит отказ. Обозначим через непрерывную СВ – длительность времени безотказной работы элемента. Если элемент проработает безотказно (до наступления отказа) время, меньшее чем , то, следовательно, за время длительностью наступит отказ. Таким образом, вероятность отказа за время длительностью определяется интегральной функцией:

. (12.8)

Тогда вероятность безотказной работы за то же время длительностью равна вероятности противоположного события, т.е.

Функцией надежности называют функцию, определяющую вероятность безотказной работы элемента за время длительностью .

Часто длительность времени безотказной работы элемента имеет показательное распределение, интегральная функция которого равна:

. (12.10)

Тогда, в случае показательного распределения времени безотказной работы элемента и с учетом (12.9) функция надежности будет равна:

. (12.11)

Пример 3. Время безотказной работы элемента распределено по показательному закону при ( время в часах). Найти вероятность того, что элемент проработает безотказно 100 часов.

Решение . В нашем примере , тогда воспользуемся (12.11):

Показательный закон надежности весьма прост и удобен для решения практических задач. Этот закон обладает следующим важным свойством:

Вероятность безотказной работы элемента на интервале времени длительностью не зависит от времени предшествующей работы до начала рассматриваемого интервала, а зависит только от длительности времени (при заданной интенсивности отказов ).

Докажем это свойство, введя следующие обозначения:

безотказная работа элемента на интервале длительностью ;

Тогда событие состоит в том, что элемент безотказно работает на интервале длительностью . Найдем вероятности этих событий по формуле (12.11), полагая, что время безотказной работы элемента подчинено показательному закону:

Найдем условную вероятность того, что элемент будет работать безотказно на интервале времени при условии, что он уже проработал безотказно на предшествующем интервале времени:

(12.13)

Мы видим, что полученная формула не зависит от , а только от . Сравнивая (12.12) и (12.13) можно сделать вывод, что условная вероятность безотказной работы элемента на интервале длительностью , вычисленная в предположении, что элемент проработал безотказно на предшествующем интервале, равна безусловной вероятности.

Итак, в случае показательного закона надежности, безотказная работа элемента "в прошлом" не сказывается на величине вероятности его безотказной работы "в ближайшем будущем".


Элементы комбинаторики

Пространство элементарных событий. Случайные события.

Вероятность

Современное понятие вероятности

Классическая вероятностная схема

Геометрические вероятности

Закон сложения вероятностей

Теорема умножения вероятностей

Формула полной вероятности

Теорема гипотез. Формула Байеса.

Повторение испытаний. Схема Бернулли.

Локальная теорема Муавра-Лапласа

Интегральная теорема Муавра-Лапласа

Теорема Пуассона (Закон редких событий)

Случайные величины

Функции распределения

Непрерывная случайная величина и плотность распределения

Основные свойства плотности распределения

Числовые характеристики одномерной случайной величины

Свойства математического ожидания

Моменты случайной величины

Свойства дисперсии

Асимметрии и эксцесс

Многомерные случайные величины

Свойства двумерной функции распределения

Плотность вероятности двумерной случайной величины

Задача Бюффона

Условная плотность распределения

Числовые характеристики системы случайных величин

Свойства коэффициента корреляции

Нормальный (гауссов) закон распределения

Вероятность попадания на интервал

Свойства нормальной функции распределения

Распределение ("хи–квадрат")

Показательный (экспоненциальный) закон распределения

Числовые характеристики показательного распределения

Функция надежности


где λ – постоянная положительная величина.

Из выражения (3.1), следует, чтопоказательное распределение определяется одним параметром λ.

Эта особенность показательного распределения указывает на его преимущество по сравнению с распределениями , зависящими от боль­шего числа параметров. Обычно параметры неизвестны и приходится находить их оценки (приближенные значе­ния) разумеется, проще оценить один параметр, чем два или три и т. д . Примером непрерывной случайной вели­чины, распределенной по показательному закону , может служить время между появлениями двух последователь­ных событий простейшего потока.

Найдем функцию распределения показательного закона .

Итак

Графики плотности и функции распределения показа­тельного закона изображены на рис. 3.1.


Учитывая, что получим:

Значения функции можно находить по таблице.

Числовые характеристики показательного распределения

Пусть непрерывная случайная величина Χ рас­пределена по показательному закону

Найдем математическое ожидание , используя формулу её вычисления для непрерывной случайной величины:


Следовательно:

Найдем среднее квадратическое отклонение , для чего извлечем квадратный корень из дисперсии:

Сравнивая (3.4), (3.5) и (3.6), видно, что

т. е. математическое ожидание и среднее квадратическое отклонение показательного распределения равны между собой.

Показательное распределение широко применяетсяв различных приложениях финансовых и технических задач, например, в теории надежности.



4. Распределение «хи-квадрат» и распределение Стьюдента.

4.1 Распределение «хи-квадрат» (- распределение)

Пусть Χ i (ί = 1, 2, ..., n)-нормальные незави­симые случайные величины , причем математическое ожи­даниекаждой из нихравно нулю , а среднее квадратическое отклонение - единице .

Тогдасумма квадратов этих величин

распределена по закону с степенями свободы , если же эти величины связаны одним линейным соотношением, например , то число степеней свободы

Распределение хи-квадрат нашло широкое применение в математической статистике.

Плотность этого распределения


где - гамма-функция, в частности .

Отсюда видно, чтораспределение хи-квадрат опре­деляется одним параметром - числом степеней свободы k.

С увеличением числа степеней свободыраспределение хи-квадрат медленно приближается к нормальному.

Хи-квадрат распределение получается, если в законе распределения Эрланга принять λ = ½ и k = n /2 – 1.

Математическое ожидание и дисперсия случайной величины, имеющей хи-квадрат распределение, определяются простыми формулами, которые приведем без вывода:

Из формулы следует, что при хи-квадрат распределение совпадает с экспоненциальным распределением при λ = ½ .

Интегральная функция распределения при хи-квадрат распределенииопределяетсячерез специальные неполные табулированные гамма-функции

На рис.4.1. приведены графики плотности вероятности и функции распределения случайной величины, имеющей хи-квадрат распределениепри n = 4, 6, 10.

Рис.4.1. а )Графики плотности вероятности при хи-квадрат распределении


Рис.4.1. б)Графики функции распределения при хи-квадрат распределении

4.2 Распределение Стьюдента

Пусть Z – нормальная случайная величина, причём

а V – независимая от Z величина, которая распределена по закону хи-квадрат с k степенями свободы.Тогда величина:


имеет распределение, которое называют t -распределением или распределением Стьюдента (псевдоним английского статистика В. Госсета),

с k = n - 1 степенями свободы (n - объём статистической выборки при решении задач статистки).

Итак , отношение нормированной нормальной величинык квадратному корню из независимой случайной вели­чины, распределенной по закону «хи квадрат» с k степе­нями свободы , деленной на k, распределено по закону Стьюдента с k степенями свободы.

Плотность распределения Стьюдента:

Случайная величина имеет равномерное распределение , если вероятность того, что она принимает любое значение в интервале, ограниченном минимальным числом а и максимальным числом b , постоянна. Поскольку график плотности этого распределения имеет вид прямоугольника, равномерное распределение иногда называют прямоугольным (см. панель Б на рис. 1).

Рис. 1. Три непрерывных распределения

Скачать заметку в формате или , примеры в формате

Функция плотности равномерного распределения задается формулой:

где а - минимальное значение переменной X , b - максимальное значение переменной X .

Математическое ожидание равномерного распределения:

(2) μ = (а + b ) / 2

Дисперсия равномерного распределения:

(3) σ 2 = (b a ) 2 / 12

Стандартное отклонение равномерного распределения:

Чаще всего равномерное распределение используется для выбора случайных чисел. При осуществлении простого случайного выбора предполагается, что каждое число извлекается из генеральной совокупности, равномерно распределенной в интервале от 0 до 1. Вычислим вероятность извлечь случайное число, превышающее 0,1 и меньше 0,3.

График функции плотности равномерного распределения для а = 0 и b = 1 изображен на рис. 2. Общая площадь прямоугольника, ограниченного этой функцией, равна единице. Следовательно, этот график удовлетворяет требованию, согласно которому, площадь фигуры, ограниченной графиком плотности любого распределения, должна равняться единице. Площадь прямоугольника, заключенная между числами 0,1 и 0,3, равна произведению длин его сторон, т.е. 0,2 х 1 = 0,2. Итак, Р(0,1 < X < 0,3) = 0,2 х 1 = 0,2.

Рис. 2. График плотности равномерного распределения; вычисление вероятности Р(0,1 < X < 0,3) для равномерного распределения при а = 0 и b = 1

Математическое ожидание, дисперсия и стандартное отклонение равномерного распределения при а = 0 и b = 1 вычисляются следующим образом:

Рассмотрим пример. Предположим, что моменты отказов устройства для контроля за чистотой воздуха равномерно распределены в течение суток.

  1. В некий день светлое время суток наступает в 5:55 и заканчиваться в 19:38. Какова вероятность того, что отказ оборудования устройства произойдет в течение светлого времени суток?
  2. Допустим, что с 22:00 до 5:00 устройство переходит в режим пониженного энергопотребления. Какова вероятность того, что отказ произойдет в указанный период времени?
  3. Предположим, что в состав устройства входит процессор, каждый час осуществляющий проверку работоспособности оборудования. Какова вероятность того, что отказ будет обнаружен не позднее, чем через 10 мин?
  4. Предположим, что в состав устройства входит процессор, каждый час осуществляющий проверку работоспособности оборудования. Какова вероятность того, что отказ будет обнаружен не раньше, чем через 40 мин?

Решение. 1. Поскольку в условии задачи сказано, что моменты отказов устройства равномерно распределены в течение суток, вероятность отказа в светлое время суток – есть доля этого времени суток. Р (отказа в светлое время суток) = 19:38 – 5:55 = 57,2%. Вычисления см. приложенный Excel-файл. Если представить разность окончания и начала светлого времени суток в процентном формате, то получим ответ – 57,2%. Хитрость заключается в том, что в Excel сутки – это единица, один час – 1/24, таким образом интервал времени меньше суток будет составлять процентную часть этих суток.

2. Р (отказа с 22:00 до 5:00) = 2:99 + 5:00 = 29,2%.

3. Р (обнаружения отказа не позднее, чем через 10 мин) = 10 / 60 = 16,7%

4. Р (обнаружения отказа не раньше, чем через 40 мин) = (60 – 40) / 60 = 33,3%

Экспоненциальное распределение

Экспоненциальное распределение является непрерывным, имеет положительную асимметрию и изменяется от нуля до плюс бесконечности (см. панель В на рис. 1). Экспоненциальное распределение оказывается весьма полезным в деловых приложениях, особенно при моделировании производства и систем массового обслуживания. Оно широко используется в теории расписаний (очередей) для моделирования промежутков времени между двумя запросами, которые могут представлять собой приход клиента в банк или ресторан быстрого обслуживания, поступление пациента в больницу, а также посещение Web-сайта.

Экспоненциальное распределение зависит только от одного параметра, который обозначается буквой λ и представляет собой среднее количество запросов, поступающих в систему за единицу времени. Величина 1/λ равна среднему промежутку времени, прошедшего между двумя последовательными запросами. Например, если в систему в среднем поступает 4 запроса в минуту, т.е. λ = 4, то среднее время, прошедшее между двумя последовательными запросами, равно 1/λ = 0,25 мин, или 15 с. Вероятность того, что следующий запрос поступит раньше, чем через X единиц времени, определяется по формуле (5).

(5) Р (время поступления запроса < X ) = 1 – e –λ x

где е - основание натурального логарифма, равное 2,71828, λ – среднее количество запросов, поступающих в систему за единицу времени, X – значение непрерывной величины, 0 < X < ∞.

Проиллюстрируем применение экспоненциального распределения примером 2. Допустим, что в отделение банка приходят 20 клиентов в час. Предположим, что в банк уже пришел один клиент. Какова вероятность того, что следующий клиент придет в течение 6 мин? В данном случае λ = 20, Х= 0,1 (6 мин = 0,1 ч). Используя формулу (5), получаем:

Р(время прихода второго клиента < 0,1) = 1 – е –20*0,1 = 0,8647

Таким образом, вероятность, что следующий клиент придет в течение 6 мин, равна 86,47%. Экспоненциальное распределение можно вычислить с помощью функции Excel =ЭКСП.РАСП() (рис. 3).

Рис. 3. Расчет экспоненциального распределения с помощью функции =ЭКСП.РАСП()

Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 379–383

Файл примера

Рассмотрим Экспоненциальное распределение, вычислим его математическое ожидание, дисперсию, медиану. С помощью функции MS EXCEL ЭКСП.РАСП() построим графики функции распределения и плотности вероятности. Сгенерируем массив случайных чисел и произведем оценку параметра распределения.

(англ. Exponential distribution ) часто используется для расчета времени ожидания между случайными событиями. Ниже описаны ситуации, когда возможно применение Экспоненциального распределения :

  • Промежутки времени между появлением посетителей в кафе;
  • Промежутки времени нормальной работы оборудования между появлением неисправностей (неисправности возникают из-за случайных внешних влияний, а не по причине износа, см. );
  • Затраты времени на обслуживание одного покупателя.

Генерация случайных чисел

Для генерирования массива чисел, распределенных по экспоненциальному закону , можно использовать формулу =-LN(СЛЧИС())/ λ

Функция СЛЧИС() генерирует от 0 до 1, что как раз соответствует диапазону изменения вероятности (см. файл примера лист Генерация ).

Если случайные числа содержатся в диапазоне B14:B213 , то оценку параметра экспоненциального распределения λ можно сделать с использованием формулы =1/СРЗНАЧ(B14:B213) .

Задачи

Экспоненциальное распределение широко используется в такой дисциплине как Техника обеспечения надежности (Reliability Engineering). Параметр λ называется интенсивность отказов , а 1/ λ среднее время до отказа .

Предположим, что электронный компонент некой системы имеет срок полезного использования, описываемый Экспоненциальным распределением с интенсивностью отказа равной 10^(-3) в час, таким образом, λ = 10^(-3). Среднее время до отказа равно 1000 часов. Для того чтобы подсчитать вероятность, что компонент выйдет из строя за Среднее время до отказа, то нужно записать формулу:

Т.е. результат не зависит от параметра λ .

В MS EXCEL решение выглядит так: =ЭКСП.РАСП(10^3; 10^(-3); ИСТИНА)

Задача . Среднее время до отказа некого компонента равно 40 часов. Найти вероятность, что компонент откажет между 20 и 30 часами работы. =ЭКСП.РАСП(30; 1/40; ИСТИНА)- ЭКСП.РАСП(20; 1/40; ИСТИНА)

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье .