Использование EXCEL для вычисления вероятностей Пуассона

Удобно рассчитывать вероятности Пуассона с помощью встроенной в EXCEL функции ПУАССОН со следующими характеристиками:

ПУАССОН (х; λ; интегральная),где

интегральная= ЛОЖЬ, если вы хотите, чтобы число наступлений события в точности равнялось х;

интегральная = ИСТИНА, если вы хотите, чтобы число наступлений события не превышало х.

Например, на рисунке 12 показана функция ПУАССОН для вычисления вероятности того, что за три года на предприятии не произойдёт ни одного несчастного случая, т.е. Х=0.

В ячейке А1 содержится формула =ПУАССОН(0;2;ЛОЖЬ) с результатом 0,135335283.

На рисунках 13 – 22 показаны функции ПУАССОН для вычисления вероятностей того, что за три года на предприятии произойдёт ровно 1 (рис. 13), 2 (рис. 14), 3 (рис. 15), 4 (рис. 16), 5 (рис. 17), 6 (рис. 18), 7 (рис. 19), 8 (рис. 20), 9 (рис.21) и 10 (рис. 22) несчастных случаев.

С помощью EXCEL мы можем также вычислить вероятность того, что за три года произойдёт менее 3-х несчастных случаев (т. е. не более 2-х — «или ноль, или один, или два») (рис. 23).

В ячейке А1 содержится формула = ПУАССОН(2;2;ИСТИНА) с результатом 0,676676416.

studopedia.org — Студопедия.Орг — 2014-2021 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.003 с) .

Экспоненциальное распределение

Какова вероятность, что за время t произойдет хотя бы одно событие? Очевидно, она будет равна 1 минус вероятность, что ни одно событие не произойдет. Подставим значение к = 0 в распределение Пуассона:

Это распределение названо экспоненциальным. Именно так распределены временные интервалы между появлением событий в пуассоновском потоке. Соответственно плотность вероятности экспоненциального распределения выражается формулой:

Экспоненциальное распределение широко применяется в теории надежности (например, для оценки вероятности отказа устройства) и при моделировании интервала времени между появлением случайных событий.

Смешанные пуассоновские распределения для моделирования числа страховых случаев

На практике параметр Пуассоновского распределения λ оказывается часто непостоянным по следующим причинам:

  • • различие параметров пуассоновского распределения у разных страхователей при моделировании количества случаев в индивидуальных моделях;
  • • различие параметра для разных лет в портфеле с одинаковыми рисками в случае коллективной модели (погодные условия, экономическая конъюнктура и др.) (например, при страховании автомобиля от аварии интенсивность зависит от количества дней с плохой погодой и не является константой).

В этом случае возникает проблема ввода дополнительной случайной величины , отвечающей за изменение параметра λ и отражающей неоднородность портфеля (в первом случае) или служащей для моделирования ежегодно меняющихся внешних воздействий в однородном портфеле коллективной модели (во втором случае).

независимые одинаково распределенные случайные величины, характеризующие индивидуальность страхователя в первом случае и "качество года" во втором. Распределение называется смешивающим распределением и выступает мерой неоднородности портфеля.

Жан Лемер (Jean Lemaire) [1] , Томас Мак (Thomas Mack) [2] предлагают для учета разнородности страхователей использовать некую функцию, называемую структурной функцией и(Х), которая приводит к так называемому смешанному (составному, сложному) пуассоновскому распределению (compound Poisson distribution).

Итак, предположим, что распределение числа страховых случаев на счету каждого застрахованного имеет пуассоновское распределение:

Причем каждый страхователь характеризуется своим значением λ, что позволяет учесть неоднородность рисков.

Дискретная случайная величина К имеет смешанный закон распределения Пуассона, если она принимает значения с параметром-функцией с вероятностями:

(3.19)

где – плотность распределения случайной величины (структурная функция).

На практике делается определенное предположение о виде смешивающего распределения, т.е. распределения случайной величины

В качестве структурной или смешивающей функции можно выбирать различные функции. Наиболее распространены в качестве смешивающего распределения и приводят в адекватным результатам:

  • – гамма-распределение;
  • – обратное гауссовское распределение.

Смешанное пуассоновское/гамма-распределение

В качестве моделирующей параметр Пуассона функции в актуарных расчетах часто используется гамма-распределение с параметрами а и b:

где – гамма-функция Эйлера,,

– натуральное число.

Его числовые характеристики:

Именно гамма-распределение хорошо описывает ситуацию, когда значения λ колеблются вокруг некоторой величины, притом что как очень маленькие, так и очень большие значения λ хоть и возможны, но маловероятны [3] .

Распределение числа страховых случаев в портфеле (рк, > тогда приводится к следующему виду:

Если а – целое, то, учитывая, что :

Таким образом, мы пришли к отрицательной биномиальной модели вида (3.16):

с параметрами и числовыми характеристиками:

Вычисление вероятностей отрицательного биномиального распределения не требует таблицы значений гамма-функции. Последовательное использование свойства позволяет перейти к рекуррентной формуле:

(3.20)

при начальном значении

(3.21)

Оценки параметров распределения по выборке с использованием метода моментов осуществляются по формулам:

(3.22)

ПРИМЕР 3.7 [4]

  • 1) число страховых случаев К имеет распределение Пуассона со средним Л;
  • 2) Л имеет гамма-распределение со средним 1 и дисперсией 2. Определите вероятность того, что К = 1 (в договоре произойдет 1 страховой случай).

Варианты ответов: а) 0,19; б) 0,24; в) 0,31; г) 0,34; д) 0,37. Решение

По условию задачи понятно, что случайная величина К имеет смешанное пуассоновское/гамма-распределение, которое приводится к отрицательному биномиальному распределению вида (3.16):

где а и b – параметры гамма-распределения, которые связаны с его математическим ожиданием и дисперсией формулами вида:

По условию

Отсюда параметры гамма-распределения:

Теперь, пользуясь формулой отрицательного биномиального распределения, можно найти искомую вероятность:

Следовательно, верный вариант ответа – а).

ПРИМЕР 3.8 [5]

Исследуем портфель, состоящий из п = 2512 договоров но страхованию автокаско. За год поступили иски по т = 888 договорам в связи со страховыми случаями. Число страховых случаев кk, произошедших по одному договору, варьировалось в изучаемом портфеле от 0 до 10 (см. таблицу).

Необходимо проверить, подходит ли смешанное пуассоновское / гамма-распределение (отрицательное биномиальное) для моделирования распределения числа страховых случаев в данном портфеле автокаско.

Решение

Найдем выборочные оценки параметров распределения числа страховых случаев в одном договоре (среднее значение):

и выборочную дисперсию

Расчетная таблица имеет следующий вид:

Расчет выборочных оценок параметров распределения числа страховых случаев в одном договоре

Итак, по результатам расчета оценок параметров распределения случайной величины К – числа страховых случаев в одном договоре, получаем:

  • – выборочная средняя:
  • – в одном договоре по портфелю происходит в течение года в среднем 0,658 страховых случаев;
  • – выборочная дисперсия:

Проверка данного эмпирического распределения на закон Пуассона дала серьезное расхождение между эмпирическими и теоретическими частотами и = 7,815. Таким образом, в рассматриваемом примере пуассоновское распределение не может служить адекватной моделью, эмпирическое распределение имеет длинный правый хвост – до 10 страховых случаев, нужно пробовать смешанные пуассоновские распределения. Итак, рассчитаем смешанное пуассоновское / гамма-распределение.

С учетом найденных выборочных характеристик, среднего и выборочной дисперсии вычислим оценки параметров гамма-распределения по (3.22):

Пользуясь рекуррентной формулой (3.20) и формулой для расчета вероятности нулевых выплат (3.21), рассчитываем теоретические частоты, результаты представим в таблице.

Расчет распределения числа исков в портфеле договоров автокаско с помощью отрицательного биномиального распределения (смешанного пуассоновского/гамма- распределения)

Число страховых случаев в договоре k

Теоретические (отриц. бином.)

частоты тк

вероятности pkT

частоты ткТ

Далее, в соответствии с требованиями критерия согласия Пирсона объединения интервалов с малыми теоретическими частотами, меньшими 5, наблюдения объединялись в группы, и вычислялось значение %211а6л.

Сравнение х?и6л = 0,806 и χ£ριιτ (а = 0,05; v = 9 – 2 – 1=6) = = 12,592 показало, что x,laft;l < χ^ριιτ, поэтому проверяемая гипотеза не отвергается, т.е. отрицательная биномиальная модель признается адекватной и достаточно точно отражает распределение числа поступивших исков. Отрицательная биномиальная модель, принятая на таком уровне надежности, может быть использована для проведения актуарных расчетов.

Полученные результаты и согласованность эмпирического и отрицательного биномиального распределения наглядно проиллюстрированы графиком (рис. 3.5).

В работах Жана Лемера, Томаса Мака, И. А. Корнилова и других ученых отмечается успешное применение отрицательного биномиального распределения в подгонке числа страховых случаев для неоднородных портфелей. Приведем пример (краткие резуль-

Выборочное и теоретическое отрицательное биномиальное распределения числа страховых случаев и расчет статистики критерия согласия Пирсона

тэты расчетов) еще более неоднородного портфеля с гораздо более длинным правым хвостом.

Моделирование числа исков по виду страхования автокаско с помощью отрицательного биномиального распределения

Рис. 3.5. Моделирование числа исков по виду страхования автокаско с помощью отрицательного биномиального распределения

ПРИМЕР 3.9

По страховому портфелю добровольного медицинского страхования, распределение числа страховых случаев в котором было приведено в качестве примера на рис. 3.4, в количестве п = 44 114 договоров были рассчитаны выборочные оценки параметров модели с использованием метода моментов по формулам (3.22):

Результаты расчета теоретических частот смешанного пуассоновского/гамма-распределения и их сравнения с эмпирическими частотами, наблюдаемыми по портфелю, приведены в таблице и на рис. 3.6.

В рассматриваемой модели (а = 0,05; v= 14) =23,685.

Следовательно, проверяемая гипотеза не отвергается на уровне значимости а = 0,05, и отрицательная биномиальная модель признается адекватной для аппроксимации распределения урегулированных убытков при моделировании числа страховых выплат в портфеле рисков по договорам медицинского страхования (ДМС).

Таблица и рис. 3.6 наглядно демонстрируют отличную согласованность изучаемой случайной величины числа страховых случаев с теоретическим смешанным пуассоновским/гамма-распределением.

Смешанное пуассоновское/обратное гауссовское распределение

Теперь изучим другой вариант смешанного пуассоновского распределения, который часто выдвигается как альтернатива отрицательному биномиальному распределению в актуарных расчетах [6] – пуассоновское/обратное гауссовское распределение.

Итак, еще один распространенный вариант смешанного закона Пуассона:

Эмпирические (тк) и теоретические кТ) частоты смешанного пуассоновского /гамма- распределения и проверка их согласия критерием Пирсона

Эмпирические и теоретические (согласно отрицательному биномиальному распределению) частоты портфеля договоров ДМС

Рис. 3.6. Эмпирические и теоретические (согласно отрицательному биномиальному распределению) частоты портфеля договоров ДМС

– использование для величины в качестве структурной или смешивающей функции плотности вероятностей обратного гауссовского распределения с параметрами g и h.

Тогда получается смешанное Пуассоновское распределение, которое называется пуассоновским/обратным гауссовским распределением с числовыми характеристиками:

Выборочными оценками для параметров распределения g и h по методу моментов являются:

(3.23)

Вероятности пуассоновского/обратного гауссовского распределения могут быть вычислены рекуррентно:

(3.24)

Затем рассчитываются теоретические частоты и с помощью критерия согласия проверяется адекватность модели исследуемому портфелю.

ПРИМЕР 3.10

По данным примера 3.8 найдем выборочные оценки для параметров обратного гауссовского распределения g и h по методу моментов (3.23): g = 0,658; h = 1,126.

Рассчитаем по рекуррентным формулам (3.24) вероятности обратного гауссовского распределения. Результаты приведем в таблице.

Расчет модели распределения числа исков в портфеле договоров автокаско с помощью смешанного пуассоновского / обратного гауссовского распределения

Число страховых случаев в договоре k

частоты mk

вероятности pkT

частоты ткт

В дальнейшем, по аналогии с предыдущими распределениями, наблюдения с теоретическими частотами, меньшими 5, объединялись в группы, и вычислялось значение у/, айл.

Расчет статистики критерия согласия Пирсона для смешанного пуассоновского / обратного гауссовского распределения числа страховых случаев

Сравнение у211айл =19,308 и χ2κρΗΤ (а = 0,05; v = 9- 2- 1=6) = = 12,592 показало, что χ2π;ι6ι > χ2 ит, поэтому проверяемая гипотеза отвергается, т.е. обратное гауссовское распределение признается неадекватной моделью и недостаточно точно отражает распределение числа поступивших исков. Хотя но значению статистики критерия согласия х2иаб, = 19,308 видно, что оно ненамного превышает критическое значение, и изучаемое распределение можно поставить на второе место в аппроксимации изучаемого распределения после отрицательной биномиальной модели.

ПРИМЕР 3.11

В другом исследованном портфеле страхования автокаско наилучшим оказалось как раз смешанное пуассоновское/обратное гауссовское распределение.

Кратко приведем только основные полученные результаты. Эмпирическое распределение, полученное с помощью СВОДНОЙ ТАБЛИЦЫ в Excel, представлено в таблице.

По выборочным характеристикам, полученным по портфелю, были найдены оценки параметров (3.23):

Далее по формуле (3.24) рассчитаны теоретические вероятности, а затем – частоты.

Расчет распределения числа исков в портфеле договоров автокаско для смешанного пуассоновского /обратного гауссовского распределения

Число страховых случаев в договоре k

частоты тк

вероятности pkT

частоты mkT

Далее, как это было сделано в предыдущих примерах, проверим соответствие модели при помощи критерия Пирсона. Выполним группировку и объединим 10-й, 11-й и 12-й интерваты так, чтобы значение теоретической частоты суммарное было больше либо равно 5. Результаты проверки гипотезы о соответствии полученного теоретического распределения эмпирическому.

Выборочное и теоретическое обратное гауссовское распределение числа страховых случаев и расчет статистики критерия согласия Пирсона

где 11 – число интервалов (после объединения правого хвоста с малыми частотами); 2 – количество оцениваемых по выборке параметров.

Как показал критерий согласия, гипотеза о том, что распределение числа страховых случаев подчиняется обратному гауссовскому распределению, не отвергается. Следовательно, данное распределение адекватно отражает эмпирическое распределение, что подтверждает график (рис. 3.7).

Модель "хорошие/плохие риски" Лемера

Жан Лемер, профессор Университета Пенсильвании, известный бельгийский актуарий, один из крупнейших исследователей в европейском автомобильном страховании, предложил для расчета количества исков еще одну модель, которая относится к смешанным пуассоновским распределениям – модель "хорошие/плохие риски" [7] . В этой модели, разработанной для аппроксимации количества исков в портфеле договоров автострахования, предполагается, что существует две категории водителей с разным уровнем аварийности – "хорошие" (для моделирования которых вводится пуассоновское распределение с параметром λ1) и "плохие"

Моделирование числа исков по виду страхования автокаско с помощью смешанного пуассоновского / обратного гауссовского распределения

Рис. 3.7. Моделирование числа исков по виду страхования автокаско с помощью смешанного пуассоновского / обратного гауссовского распределения

водители (характеризуются значением параметра λ2). Смешивающее распределение Л здесь – двухточечное дискретное. Оценки теоретических вероятностей рассчитываются с помощью формулы

(3.25)

где

Оценки параметров распределения по методу моментов рассчитываются по следующим формулам [3] :

(3.26)

(3.27)

где – начальные выборочные моменты 1-го, 2-го и 3-го соответственно порядка случайной величины К – числа страховых случаев, наступивших за год в одном договоре.

Далее рассчитываются теоретические частоты и с помощью критерия согласия проверяются на согласованность с эмпирическими.

ПРИМЕР 3.12

Проанализируем реальный портфель договоров страхования ОСАГО одной из крупных московских страховых компаний.

Сгруппировав все договоры по числу наступивших за год страховых случаев, получим следующее эмпирическое распределение числа исков:

Выборочное распределение числа поступивших исков К по договорам страхования ОСАГО

Количество исков k

Количество договоров тк

Для нашего портфеля из 111 500 договоров рассчитаны следующие оценки параметров распределения по (3.26) и (3.27):

Рассчитанные выборочные оценки параметров распределения модели "хорошие/плохие риски"

а

b

А

В

аг

Полученные результаты свидетельствуют о том, что доля "хороших" водителей в портфеле составляет около 91,85% и в среднем они попадают в 0,02 аварии в год. Остальные 8,15% – "плохие" водители, у них частота страхового случая составляет 0,42 аварии в год.

Для проведения дальнейшего анализа следует вычислить теоретические вероятности и частоты, подставляя найденные параметры в закон распределения Лемера (3.25):

В таблице представлены теоретические вероятности и частоты, рассчитанные по полученной формуле аппроксимирующего закона: Следует заметить, что доля "хороших" водителей намного больше, чем "плохих", что делает выбор модели Лемера вполне

Число страховых случаев в договоре

частоты mk

вероятности ркт

частоты mkT

адекватным. Кроме того, вероятность аварии в целом по портфелю достаточно мала.

Как можно заключить из рассмотренной таблицы и рис. 3.8, модель Лемера очень точно отражает распределение страховых случаев в одном договоре, так как расхождение в теоретических и эмпирических частотах минимально.

Проверим этот довод с помощью критерия Пирсона. Итак, (напомним, что по выборке оценивалось три параметра распределения в отличие от всех предыдущих моделей). Гипотеза не отвергается, а модель "хороших и плохих рисков" Лемера признается адекватной для аппроксимации распределения числа страховых слу-

Моделирование числа исков по виду страхования ОСАГО с помощью модели Лемера

Рис. 3.8. Моделирование числа исков по виду страхования ОСАГО с помощью модели Лемера "хорошие/плохие риски"

чаев в портфеле ОСАГО. Такое редкое согласие между эмпирическими и теоретическими частотами напоминает, что модель была разработана Лемером именно для страхования автогражданской ответственности владельцев транспортных средств, и портфель страхования ОСАГО русской страховой компании оказался тоже подходящим этому распределению.

Представленная модель "хорошие/плохие риски" может быть использована для аппроксимации распределения числа урегулированных убытков во многих других видах страхования, где страхователей также можно разделить на группы с разной вероятностью наступления страхового случая.

ПРИМЕР 3.13

По данным примеров 3.8 и 3.10 рассчитаем модель Лемера.

Для исследуемого портфеля договоров страхования автокаско рассчитаны следующие оценки параметров распределения.

Полученные оценки могут быть интерпретированы следующим образом: в рассматриваемый портфель договоров попало 87,81% ( β] ) "хороших" водителей, частота страховых случаев которых составляет 0,33 аварии в год ( λ, ), и 12,19% "плохих" водителей, которые в год совершают в среднем 2,97 аварии.

Таким образом, вероятности смешанного пуассоновского распределения модели "хорошие риски/плохие риски", аппроксимирующего распределение числа исков в исследуемом портфеле, будем рассчитывать по следующей формуле:

Результаты расчетов приведены в таблице.

Теперь с помощью критерия согласия χ2 проверим гипотезу об адекватности построенной модели.

Х2найл = 37,882 > χ2κρΜΤ (а = 0,05; ν = 8- 3-1=4) = 9,488 (обратите внимание – здесь мы по выборке оценивали три параметра – α,, λ i, λ2), следовательно, гипотеза отвергается. Модель "хорошие риски /плохие риски" признается неадекватной для распределения урегулированных убытков.

Расчет распределения числа исков в портфеле договоров автокаско с помощью смешанного пуассоновского распределения модели "хорошие риски/плохие риски" (по Ж. Лемеру)

Число страховых случаев в договоре k

Эмпирические частоты тк

(смеш. Пуассон, хор./плох. риски)

вероятности Рь

частоты ткТ

Выборочное и теоретическое смешанное пуассоновское распределение модели "хорошие/нлохие риски" числа страховых случаев и расчет статистики критерия согласия Пирсона

Результаты применения критерия согласия Пирсона но всем исследованным распределениям (по результатам расчетов примеров 3.8, ЗЛО, 3.13) сведем в итоговую таблицу.

Результаты расчета статистики критерия согласия Пирсона для всех рассмотренных распределений, моделирующих число страховых случаев в одном договоре страхования автокаско

Гипотеза не отвергается

Кроме того приведем график (рис. 3.9), на котором видны все полученные результаты и какое теоретическое распределение как моделирует все частоты эмпирического.

Статистическое исследование и моделирование числа исков в рассмотренном портфеле договоров страхования позволили сделать вывод, что в исследуемой совокупности страховых договоров наиболее подходящей моделью нужно признать отрицательное биномиальное распределение, являющееся смешанным пуассоновским/гамма-распределением.

В актуарной литературе имеются работы, в которых рассматривались и другие смешанные пуассоновские модели [3] .

Виллмот (Willmot) получил простую рекуррентную формулу, которая работает для широкого ряда непрерывных смешивающих распределений. В качестве смешивающих распределений он использовал бета-распределение, равномерное распределение, распределение Парето, а также обобщенное распределение Парето. Кроме того, он рассматривал отрицательное биномиальное распределение, пуассоновское бета-распределение и обобщенные гауссовские модели.

Альбрехт (Albrecht) рассматривал смеси пуассоновского распределения с такими распределениями, как семейство Пирсона, распределение Вейбулла, Парето, Бесселя, усеченное нормальное распределение, хи-квадрат и др. Он также

Моделирование числа исков по страхованию автокаско с помощью пуассоновского и трех смешанных пуассоновских распределений

Рис. 3.9. Моделирование числа исков по страхованию автокаско с помощью пуассоновского и трех смешанных пуассоновских распределений

высказывал соображения в пользу дискретных смесей пуассоновских распределений.

Делапорте (Delaporte) впервые ввел, а Рюохонен (Ruohonen), Виллмот и Сундт (Sundt) продолжили изучение смешанного пуассоновского распределения со смешивающим распределением, которое является гамма-распределением со сдвигом с тремя параметрами. При таком подходе процесс наступления страховых случаев состоит из двух независимых компонент, пуассоновского процесса, который отражает общий вклад всех рисков, и отрицательного биномиального процесса, который отвечает за индивидуальный вклад определенного риска.

Трехпараметрическая смешанная пуассоновская модель Пейнджера (Panjer) является паскалевским обобщением пуассоновского распределения и содержит в качестве частных случаев отрицательное биномиальное распределение, распределение Пойа, неймановское типа А и пуассоновское обратное гауссовское распределение.

Что такое функция ПУАССОН.РАСП в Excel? Что с ее помощью делают?

Функция ПУАССОН.РАСП статистическая функция, она определяет распределение Пуассона, проще говоря она вычисляет количество предполагаемых событий, за определенную единицу времени, например сколько людей зайдет в магазин в период с 17-00 до 18-00.

ACOSH(число) — Возвращает гиперболический арккосинус числа. В качестве аргумента выступает число с плавающей точкой (как двойной, так и одинарной точности), также в качестве аргумента может приниматься целое число. Число должно быть равно или больше единицы.

Функция SINH в Microsoft Excel относится к функциям математики и тригонометрии, она вычисляет гиперболический синус заданного угла, используя для этого один аргумент ( который является обязательным) — любое вещественное число.

PHONETIC это функция Microsoft Excel, которая относится к подразделу текстовых функций. Эта функция извлекает фонетические знаки, которые называются фуригана, из выбранного текста или выбранной текстовой строки.

Функция БЗРАСПИС в Microsoft Excel относится к финансовым функциям, и она вычисляет сколько составит заданная сумма, когда она изменится за счет сложных процентных ставок. В основном используется для определения будущей суммы инвестиции с изменением процентных ставок.

Функция TAN в Excel

выполняет возвращение тангенса числа/заданного угла.

Применяется функция TAN в формуле для вычисления тангенса заданного угла.

Подробнее о том, как действует применение формулы с использованием функции TAN Вы найдете здесь.

Использование в ставках

Модель Пуассона получила наибольшее распространение в видах спорта с низкой результативностью: в основном футбол, а также хоккей, футзал, некоторые другие дисциплины со средним тоталом матчей 3-7.

Математическая модель Пуассона позволяет рассчитать сразу ряд параметров матчей:

  • Индивидуальные тоталы играющих команд;
  • Наиболее вероятный счет матча (исходя из полученных вероятностей, можно сделать ставки на 2-3 итоговых счета игры);
  • Тотал матча;
  • Составить линию на спортивное событие.

Расчет вероятности счета матча

Разберем распределение Пуассона на основании определения наиболее вероятного счета матча «Бавария – Айнтрахт» сезона 2019/2020. Для расчетов нам нужны данные по забитым и пропущенным мячам и играм «Баварии» дома в текущем сезоне (по истечении 26-и туров), а также аналогичные показатели «Айнтрахта» в гостях и средние показатели этих параметров. Также необходимо знать число сыгранных встреч и взятий ворот дома и в гостях.

Читайте также: 
Забитых голов дома (Бундеслига) Забитых голов на выезде (Бундеслиге) Всего домашних голов Пропущенных дома голов Забито Айнтрахтом в гостях Пропущено Айнтрахтом в гостях
Голы 401 354 38 11 11 25
Матчи 233 233 13 13 12 12
Голов за матч 1.72 1.52 2.92 0.846 0.916 2.08

Далее рассчитываем силу атаки и силу обороны «Баварии» и «Айнтрахта» по следующему алгоритму:

  • Находим силу атаки «Баварии». Для этого делим его среднее количество голов на своем поле на среднее число домашних голов в лиге: 2,92 / 1,72 = 1,7;
  • То же самое у «Айнтрахта». Делим средний тотал гостевых голов «Айнтрахта» на средний тотал голов на выезде в чемпионате: 0.916 / 1.52 = 0.6;
  • Находим силу оборонительных построений «Баварии». Для этого делим среднее число пропущенных им голов дома на среднее число голов, забитых в лиге на выезде: 0.846 / 1.52 = 0,557;
  • То же самое для «Айнтрахта». Делим пропущенные им голы на выезде на средний тотал голов в домашних матчах Бундеслиги: 2.08 / 1.72 = 1.21;
  • Далее рассчитываем вероятный индивидуальный тотал голов для каждой дружины;
  • Для «Баварии» перемножаем рассчитанную ранее силу атаки мюнхенцев, силу обороны «Айнтрахта» и среднее число домашних голов в лиге: 1.7*1.21*1.72 = 3.54;
  • Тот же параметр для «Айнтрахта»: перемножаем силу атаки «Айнтрахта», силу обороны «Баварии» и средний тотал гостевых голов в АПЛ: 0.6*0.557*1.52 = 0.51.

Согласно расчету, матч должен завершиться со счетом 3.54-0.51 в пользу «Баварии».

Вероятность голов каждой команды

Далее нужно внести все необходимые данные в онлайн-калькулятор Пуассона, он выдаст вероятность забитых голов в игре для «Баварии» и «Айнтрахта».

Распределение Пуассона в ставках на спорт

Источник фото: bettor.in.ua

Также необходимо внести число голов дома и на выезде в лиге, количество завершенных туров, количество команд в лиге, и то же самое, но для «Баварии» и «Айнтрахта» в отдельности. В итоге калькулятор выдаст проценты вероятности забития 0, 1, 2, 3, 4 и более голов для обеих команд:

Распределение Пуассона в ставках на спорт

Источник фото: bettor.in.ua

Итак, из расчета видно, что наиболее вероятный тотал голов «Баварии» в матче – это 3 и 4 (вероятность 21 и 19%). Чуть меньше шансов на то, что мюнхенский суперклуб забьет 2 гола (18%). Наиболее вероятное количество голов «Айнтрахта» – 0 голов (вероятно на целых 60%). Шансы франкфуртцев на то, чтобы забить 1 гол равны 30%, что также немало. Т.е. можно прикинуть наиболее вероятный счет матча: победа «Баварии» со счетом 3:0, 3:1, 4:0 или 4:1.

Ко всему прочему, калькулятор определяет вероятность победы «Баварии», ничьей и победы «Айнтрахта» в матче, т.е. можно получить и линию на матч, разделив 100 на каждую из данных вероятностей. Сравнив полученную по Пуассону линию с той, что предложена букмекерами, можно отыскать валуйные варианты для ставок.

Матч между «Баварией» и «Айнтрахтом» в итоге завершился со счетом 5:2 в пользу хозяев, тогда как ожидаемый счет матча согласно расчету получился 3.55-0.51. По форе угадали точно, с тоталом матча и индивидуальными тоталами команд расчет несколько разошелся.

Что такое функция ПУАССОН в Excel? Что с ее помощью делают?

Возвращает распределение Пуассона. Обычное применение распределения Пуассона состоит в предсказании количества событий, происходящих за определенное время, например количества машин, появляющихся на площади за одну минуту.

ПУАССОН это математическая функция екселя, она применяет совершенно обычное распределение Пуассона, и предсказывает заданное количество событий, которые могут происходить за заданное время. С помощью этой функции можно определить сколько людей появится в холле за определенное время.

Функция ТРАНСП в Microsoft Excel это функция поиска и ссылок, она преобразует вертикальные диапазон заданных ячеек в вертикальный вид, или наоборот вертикальный диапазон ячеек в горизонтальный вид.

Функция ЦЕНА в Excel

используется для возвращения номинальной стоимости ценных бумагцены за 100 рублей, по которым выплачивается % (периодический).

Содержит эта функция аж шесть (!) обязательных аргументов и один не обязательный агрумент Базис.

Подробнее о её применении тут.

Эта функция в Microsoft Excel отвечает за поиск и ссылку. Функцию можно использовать для получения ячейки на листе по строке и столбцу. Использует три армугента, тип ссылки, номер строки и номер столбца. Так-же в качестве аргумента можно использовать и другие функции Екселя.

Функция ВЫЗВАТЬ в Microsoft Excel относится к автоматизации и настройке к екселе, и с ее помощью можно вызвать процедуру или процесс из библиотеки ДЛЛ. Использует четыре аргумента для расчета: Имя_модуля, Процедура, Типы_данных, Аргумент1 и т.д.

Функция ДИСПРА в Microsoft Excel это функция статистики, которая занимается вычислением дисперсии по генеральной совокупности, при этом используя от одного до двухсот пятидесяти пяти аргументов, где только один обязательный ( значение 1), а остальные необязательные.

теория-вероятностей — Вывод распределения Пуассона из Биномиального распределения.

$< P >_< n >(m)=\frac < n! > < m!(n-m)! >p^< m >< (1-p) >^< n-m >$ ,где m — число благоприятных исходов, n — число испытаний, p — вероятность благоприятного исхода.

Введем обозначение $%

=<\lambda>$% (мат ожидание обоих распределений).

Если $%p\longrightarrow0$%, $%q\longrightarrow1$% и $%n\longrightarrow\infty$% получаем распределение Пуассона:

Нужно решить предел и по идее получить единицу, но с пределами у меня плоховато. Объясните пожалуйста, как его решить?

Разобрался в этом сам.

Из него видно, что дробь образовавшаяся на месте факториалов в пределе дает единицу, то же касается сомножителя в степени $%-m$%.

2.3.3. Распределение Пуассона

Случайная величина , распределённая по этому закону, принимает бесконечное и счётное количество значений , вероятности появления которых определяются формулой:

Или, если расписать подробно:

Вспоминая разложение экспоненты в ряд, легко убедиться, что:

Математическое ожидание пуассоновской случайной величины равно и дисперсия – тому же самому значению: .

Во всех задачах параграфа Формула Пуассона мы лишь ПОЛЬЗОВАЛИСЬ распределением Пуассона для приближенного расчёта вероятностей, в то время как ТОЧНЫЕ значения следовало находить по формуле Бернулли, т.е., там имело место биномиальное распределение. И последующие задачи отличаются принципиально
– отличие состоит в том, что сейчас речь идёт именно о РАСПРЕДЕЛЕНИИ Пуассона:

Задача 99
Случайная величина подчинена закону Пуассона с математическим ожиданием, равным . Найти вероятность того, что данная случайная величина примет значение, меньшее, чем её математическое ожидание.

Решение: известно, что математическое ожидание распределения Пуассона в точности равно , таким образом, случайная величина принимает значения с вероятностями:

Интересующее нас событие состоит в трёх несовместных исходах: случайная величина примет значение или , или . По теореме сложения вероятностей несовместных событий:
– вероятность того, что случайная величина примет значение, меньшее, чем ее математическое ожидание.

Ответ:

Аналогичная задача на понимание:

Задача 100
Случайная величина подчинена закону Пуассона с единичным математическим ожиданием. Найти вероятность того, что данная случайная величина примет положительное значение.

Решение и ответ в конце книги.

Помимо прочего, распределение Пуассона нашло широкое применение в теории массового обслуживания для вероятностной характеристики простейшего потока событий. Постараюсь быть лаконичным:

Пусть в некоторую систему поступают заявки (телефонные звонки, приходящие клиенты и т.д.). Поток заявок называют простейшим, если он удовлетворяет условиям стационарности, отсутствия последствий и ординарности.
Стационарность подразумевает то, что интенсивность заявок постоянна и не зависит от времени суток, дня недели или других временнЫх рамок. Иными словами, не бывает «часа пик» и не бывает «мёртвых часов». Отсутствие последствий означает, что вероятность появления новых заявок не зависит от «предыстории», т.е. нет такого, что «одна бабка рассказала» и другие «набежали» (или наоборот, разбежались). И, наконец, свойство ординарности характеризуется тем, что за достаточно малый промежуток времени практически невероятно появление двух или бОльшего количества заявок. «Две старушки в дверь?» – нет уж, увольте, рубить удобнее по порядку.
Итак, пусть в некоторую систему поступает простейший поток заявок со средней интенсивностью заявок в некоторую единицу времени (минуту, час, день или в любой другой). Тогда вероятность того, что за данный промежуток времени, в систему поступит ровно заявок, равна:

Поразительно, с какой скоростью устаревают задачи:

Задача 101
Звонки в диспетчерскую такси представляет собой простейший пуассоновский поток со средней интенсивностью 30 вызовов в час. Найти вероятность того, что: а) за 1 мин. поступит 2-3 вызова, б) в течение пяти минут будет хотя бы один звонок.

Решение: используем формулу Пуассона:

а) Учитывая стационарность потока, вычислим среднее количество вызовов за 1 минуту:
вызова – в среднем за одну минуту.

По теореме сложения вероятностей несовместных событий:
– вероятность того, что за 1 минуту в диспетчерскую поступит 2-3 вызова.

б) Вычислим среднее количество вызов за пять минут:

По формуле Пуассона:
– вероятность того, что в течение 5 минут не будет ни одного звонка.

По теореме сложения вероятностей противоположных событий:
– вероятность того, что в течение 5 минут будет хотя бы один вызов.

Ответ: а) , б)

Обращаю внимание, что в отличие от задач параграфа Формула Пуассона, эту задачу уже нельзя решить по формуле Бернулли. По той причине, что заранее не известно общее количество исходов (точное количество звонков в тот или иной час).
И предсказать это значение, разумеется, невозможно.

Для самостоятельного решения:

Задача 102
Среднее число автомобилей, проходящих таможенный досмотр в течение часа, равно 3. Найти вероятность того, что: а) за 2 часа пройдут досмотр от 7 до 10 автомобилей; б) за пол часа успеет пройти досмотр только 1 автомобиль.

Таможня пройдена, достаём припрятанное:

Полную и свежую версию этой книги в pdf-формате ,
а также курсы по другим темам можно найти здесь.

Также вы можете изучить эту тему подробнее – просто, доступно, весело и бесплатно!

Распределение Пуассона

Когда Распределение Пуассонаблизко к 0 или 1, формула Муавра дает результаты, которые значительно отклоняются от результатов, полученных по формуле (6.1). Рассмотрим случай, когда при возрастании Распределение Пуассонавероятность Распределение Пуассонапоявления интересующего нас события убывает, а Распределение Пуассона— постоянное число.

Распределение Пуассона представляет собой дискретное распределение вероятностей, которое моделирует случайную величину, которая представляет количество событий, которые произошли за период времени, когда эти события происходят с определенной фиксированной средней интенсивностью и не зависят друг от друга.

Именно такая ситуация возникает, когда имеем дело с редко происходящими событиями. По формуле (6.2)

Распределение Пуассона

Поскольку Распределение Пуассона

Распределение Пуассона

Распределение Пуассона(6.5)

Установим предельные значения Распределение Пуассонаи Распределение Пуассонапри неограниченном возрастании Распределение Пуассона. Ясно, что Распределение Пуассона

ОбозначимРаспределение Пуассона. Тогда Распределение Пуассона

Поскольку Распределение Пуассона, то при Распределение Пуассона

Распределение Пуассона

Пусть Распределение Пуассона, тогда при Распределение Пуассона.

Получаем Распределение Пуассона

Значит, когда Распределение Пуассонавелико, то Распределение ПуассонаПодставляя эти значения в (6.5), находим формулу Пуассона:

Распределение Пуассона(6.6)

По этой ссылке вы найдёте полный курс лекций по высшей математике:

Распределение Пуассона

Примеры с решением

Пример 1.

Какова вероятность того, что среди 500 наугад выбранных человек двое родились 1-го мая?

Решение:

Естественно считать, что день рождения незнакомого человека может быть с равной вероятностью любым днем года. Нам предстоит вычислить Распределение Пуассона. Так как Распределение Пуассона, Распределение Пуассона, то Распределение Пуассона. По формуле (6.6) Распределение Пуассона

При вычислении этого и подобных выражений полезно пользоваться таблицей 3. Полезно также запомнить, что Распределение Пуассона

Пример 2.

Среди 1000 человек приблизительно 8 левшей. Какова вероятность того, что среди сотни наугад выбранных человек не окажется ни одного левши?

Решение:

В этом случаеРаспределение Пуассона. Отсюда Распределение Пуассона.

Распределение Пуассона

Кроме того, поскольку момент и факторный момент связаны линейно, факторный момент часто изучается для распределения Пуассона, из которого при необходимости можно получить нормальный момент.

Возможно вам будут полезны данные страницы:

Распределение пуассона с примерами

В разделе VI-3 формула Пуассона (6.6) служила удобным приближением для биномиального распределения в случае большого Распределение Пуассонаи малого Распределение Пуассона. Существуют также и другие распределения вероятностей, которые приводят в пределе к формуле Пуассона (6.6). Мы сталкиваемся здесь с проявлением того факта, что существует несколько распределений большой общности, встречающихся в разнообразных задачах. Тремя чаще всего встречающимися распределениями являются биномиальное (оно нами рассмотрено в главе VI), нормальное и распределение Пуассона, которое мы теперь рассмотрим более основательно.

Будем говорить, что-случайная величина Распределение Пуассонараспределена по закону Пуассона, если она принимает значения Распределение Пуассонас вероятностями

Распределение Пуассона(7.17)

Математическое ожидание такой величины может быть представлено бесконечным рядом: Распределение Пуассона

Но Распределение Пуассона

Поэтому Распределение Пуассонаи Распределение Пуассона

Значит, в формуле (7.17) Распределение Пуассонапредставляет среднее значение случайной величины Распределение Пуассонараспределенной по закону Пуассона.

Рассмотрим такие последовательности случайных событий, примерами которых могут служить вызовы, поступающие на телефонную станцию, заходы судов в порт, испускание Распределение Пуассона-частиц радиоактивным веществом и т. д. Каждое событие можно изобразить точкой на оси времени, тогда получаем случайное распределение точек. Покажем, что на величину

Распределение Пуассона

можно смотреть как на вероятность иметь Распределение Пуассонаточек ( Распределение Пуассонасобытий) внутри интервала определенной длины.

Пусть условия опыта остаются неизменными во времени и неперекрывающиеся интервалы времени независимы в том смысле, что число событий на одном интервале не зависит от числа событий на других интервалах.

Представим единичный интервал времени, разделенный на Распределение Пуассонаинтервалов ( Распределение Пуассона— большое число), длина каждого из которых Распределение Пуассона.

Пусть любой из интервалов либо пуст, либо содержит по крайней мере одну случайную точку, т. е. интервал не пуст. Пусть событие А — «интервал непуст». Поскольку длина всех интервалов одинакова, то для любого нз интервалов вероятность события А должна быть одной и той же. Обозначим Распределение Пуассона. Пусть Распределение Пуассонапри неограниченном возрастании Распределение Пуассона. Тогда по формуле (6.6) вероятность того, что среди Распределение Пуассонанеперекрывающихся интервалов Распределение Пуассонанепустых: Распределение Пуассона

Здесь, конечно, Распределение Пуассонане означает числа случайных точек на единично* интервале, ибо в любом из непустых интервалов мы можем иметь несколько случайных точек. Однако естественно ввести дополнительное допущение, что вероятностью появления двух или более событий в течение очень короткого промежутка времени можно в пределе пренебречь. Таким образом, вероятность иметь в единичном интервале времени Распределение Пуассонаслучайных точек получается как предел Распределение Пуассонапри Распределение Пуассона. Если эту вероятность обозначим Распределение Пуассона

то Распределение Пуассона

Если вместо единичного интервала мы возьмем произвольный интервал длины Распределение Пуассонаи снова воспользуемся разбиением на интервалы

длины Распределение Пуассонато мы получим испытания Бернулли с той же самой вероятностью Распределение Пуассонано количество испытаний будет равно уже не Распределение Пуассонаа ближайшему к Распределение Пуассонацелому числу. Переход к пределу такой же, только вместо Распределение Пуассонамы получим Распределение ПуассонаЭто приводит к истолкованию величины

Распределение Пуассона(7.20)

как вероятности иметь Распределение Пуассонаслучайных точек на фиксированном интервале длины Распределение Пуассона. В частности, вероятность’того, что на интервале длины Распределение Пуассонане будет ни одной точки, равна

Распределение Пуассона(7.21)

Параметр к определяет плотность точек на осиРаспределение Пуассона. Из формулы (7.21) видно, что, чем больше Распределение Пуассона, тем меньше вероятность события, состоящего в том, что интервал Распределение Пуассонапуст. Формула (7.20) может быть применена при решении разных задач.

Пример 3.

Автоматическая телефонная станция получает в среднем за час 540 вызовов. Какова вероятность того, что в данную минуту она получит ровно 20 вызовов?

Решение:

Так как вызовы независимы друг от друга, число вызовов за промежуток времени Распределение Пуассонамин распределяется по закону Пуассона. Произведение kt мы можем рассматривать как среднее число точек, приходящееся на интервал времени длины Распределение Пуассона. Таким образом, по условию задачи

Распределение Пуассона

По формуле (7.20), зная, что Распределение Пуассона, находим

Распределение Пуассона

Распределение Пуассона

Пример 4.

В аэропорту производят посадку в среднем 3 самолета в минуту. Какова вероятность того, что в течение 2 мин произведут посадку не меньше 4 самолетов?

Решение:

Пусть событие А — «произвели посадку не меньше 4 самолетов».

Противоположное ему событие А — «произвели посадку меньше 4 самолетов». Обозначим события:

Распределение Пуассона— «не было ни одной посадки», Распределение Пуассона— «состоялась одна посадка», Распределение Пуассона— «состоялись две посадки», Распределение Пуассона— «состоялись три посадки».

Понятно, что Распределение ПуассонаПоскольку события Распределение Пуассонанесовместимы, то

Распределение Пуассона

Соответственно условию задачи Распределение ПуассонаПоэтому по формуле (7.20) и таблице 3

Распределение Пуассона

Получаем: Распределение Пуассона. Поскольку Распределение Пуассона, то Распределение Пуассона

Пример 5.

На прядильной фабрике работница обслуживает по нескольку сотен внешне практически ничем не отличимых веретен. При вращении веретена пряжа из-за неравномерности натяжения и других причин рвется в случайные моменты времени. Для производства важно знать, как часто могут происходить обрывы пряжи в зависимости от тех или иных условий (сорт пряжи, скорость вращения веретен и т. д.). Пусть работница обслуживает 800 веретен и вероятность обрыва пряжи в течение одной минуты 0,0005. Найти вероятность того, что в течение 10 мин произойдет не более 2 обрывов.

Решение:

Пусть событие А — «произойдет не более 2 обрывов». Обозначим события: Распределение Пуассона— «обрывов не произошло», Распределение Пуассона— «произошел один обрыв», Распределение Пуассона— «произошли два обрыва». Ясно, что Распределение Пуассона

Согласно условию задачи Распределение Пуассона

По формуле (7.20) и таблице 3: Распределение ПуассонаПоскольку Распределение Пуассона, то

Распределение Пуассона.

Распределение Пуассона

Распределение Пуассона

Присылайте задания в любое время дня и ночи в whatsapp.

  • Готовые заказы по всем предметам
  • Готовые заказы по высшей математике
  • Готовые заказы по физике
  • Готовые заказы по химии
  • Готовые заказы по экономике

Официальный сайт Брильёновой Натальи Валерьевны преподавателя кафедры информатики и электроники Екатеринбургского государственного института.

Все авторские права на размещённые материалы сохранены за правообладателями этих материалов. Любое коммерческое и/или иное использование кроме предварительного ознакомления материалов сайта natalibrilenova.ru запрещено. Публикация и распространение размещённых материалов не преследует за собой коммерческой и/или любой другой выгоды.

Сайт предназачен для облегчения образовательного путешествия студентам очникам и заочникам по вопросам обучения . Наталья Брильёнова не предлагает и не оказывает товары и услуги.

1.10. Формула Пуассона

Если количество независимых испытаний достаточно велико (100 и больше),
а вероятность появления события в отдельно взятом испытании весьма мала (0,05-0,01 и меньше), то вероятность того, что в данной серии испытаний событие появится ровно раз, можно вычислить приближённо по формуле Пуассона:
, где (вместо «лямбды» также используют букву «а»).

Утопичная, конечно, задача, но что делать – таких много:)

Задача 72
В новом микрорайоне поставлено 10000 кодовых замков на входных дверях домов. Вероятность выхода из строя одного замка в течение месяца равна 0,0002. Найти вероятность того, что за месяц откажет ровно 1 замок.

Решение: в данном случае количество «испытаний» велико, а вероятность «успеха» в каждом из них – мала: , поэтому используем формулу Пуассона:
, по условию, требуется найти вероятность того, что за месяц откажет ровно замок

Вычислим: – по существу, это среднеожидаемое количество вышедших из строя замков.

Таким образом:
– вероятность того, что за месяц из строя выйдет ровно один замок (из 10 тысяч).

Ответ:

С технической точки зрения результат можно получить несколькими способами, расскажу о них в историческом ракурсе:

1) С помощью специальной таблицы, которая до сих пор встречается в некоторых книгах. В данную таблицу сведены различные значения и соответствующие им вероятности. Табулирование обусловлено тем, что в своё время не существовало бытовых калькуляторов, на которых можно было бы подсчитать значения экспоненциальной функции. Отсюда, кстати, идёт традиция округлять вычисления до 4 знаков после запятой – как в стандартной таблице.

2) С помощью прямого вычисления на микрокалькуляторе (прогресс!), именно этим способом я и провёл вычисления.

3) С помощью стандартной экселевской функции: ПУАССОН(m; лямбда; 0),
в данной задаче забиваем в любую ячейку Экселя =ПУАССОН(1; 2; 0) и жмём Enter.

Следует отметить, что развитие вычислительной техники фактически отправило в историю рассмотренное решение – по той причине, что ответ легко вычислить более точно* по формуле Бернулли, например, с помощью функции БИНОМРАСПприложения MS Excel:

* и, разумеется, существует абсолютно точное значение с длинным «хвостом».

Но формула Пуассона, тем не менее, даёт очень крутое приближение:
– с погрешностью только на 9-м знаке после запятой!

Впрочем, это всё лирика, решать-то всё равно нужно по формуле Пуассона, пока я и мои коллеги не написали для вас новые учебники:) Ну а пока классика жанра:

Задача 73
Завод отправил в торговую сеть 500 изделий. Вероятность повреждения изделия в пути равна 0,003. Найти вероятность того, что при транспортировке будет повреждено:
а) ни одного изделия, б) ровно три изделия, в) более трех изделий.

Решение: используем формулу Пуассона:
, в данном случае: – среднеожидаемое количество повреждённых изделий

а)
– вероятность того, что все изделия дойдут в целости и сохранности, как бы сказал опытный логист, ничего не украли J

б)
– вероятность того, что в пути будут повреждены ровно 3 изделия из 500.

в) (больше трёх изделий). Это или 4, или 5, или 6, или, …, или 500 штук. Но считать сумму , мы, конечно не будем 🙂

Приём уже знаком – «заходим с чёрного хода». Сначала найдём – вероятность того, что в пути повредятся не более трёх изделий. По теореме сложения вероятностей несовместных событий:

И по теореме сложения вероятностей противоположных событий:
– вероятность того, что при доставке будет повреждено более 3 изделий.

Ответ: а) , б) , в)

Само собой, ручками это всё считать надоест, и поэтому я добавил в Калькулятор (Пункт 7) автоматическое вычисление этих вероятностей.

Следующий пример самостоятельно; по возможности, проведите вычисления несколькими способами:

Задача 74
Вероятность изготовления бракованных деталей при их массовом производ­стве равна . Определить вероятность того, что в партии из 800 деталей будет: а) ровно 2 бракованные, б) не более двух.

Иногда условие встречается в несколько другой интерпретации. Так, в предложенной задаче может идти речь о том, что производственный брак составляет 0,1% или, например, «в среднем 0,8 детали на каждую тысячу». Обратите внимание, что в последнем случае нам дано готовое значение «лямбда».

Читайте также:  Трехмерные ссылки в формулах Excel

Ни в коем случае не отключаем голову – даже в таких простых примерах!

Ещё раз подчёркиваю, что формула Пуассона лишь приближает формулу Бернулли, и на самом деле это её не единственное применение. В следующей главе мы познакомимся с распределением Пуассона и разберём другие задачи с этой формулой.

Полную и свежую версию этой книги в pdf-формате ,
а также курсы по другим темам можно найти здесь.

Также вы можете изучить эту тему подробнее – просто, доступно, весело и бесплатно!

Распределение и формула Пуассона

В данной статье мы рассмотрим ещё одно дискретное распределение, которое получило широкое распространение на практике. Не успел я открыть курс по теории вероятностей, как сразу стали поступать запросы: «Где Пуассон? Где задачи на формулу Пуассона?» и т.п. И поэтому я начну с частного применения распределения Пуассона – ввиду большой востребованности материала.

Задача до боли эйфории знакома:

– проводится независимых испытаний, в каждом из которых случайное событие может появиться с вероятностью. Требуется найти вероятность того, что в данной серии испытаний событие появится ровно раз.

Наверное, вам уже снится формула Бернулли🙂

тем более, на уроке о биномиальном распределении вероятностей мы разобрали ситуацию по косточкам.

В том случае, если количество испытаний велико (сотни и тысячи), эту вероятность обычно рассчитывают приближённо – с помощью локальной теоремы Лапласа: , где .

Однако и тут есть «слабое звено» – теорема Лапласа начинает серьёзно барахлить (давать большую погрешность), если вероятность меньше, чем 0,1 (и чем меньше, тем всё хуже). Поэтому здесь используют другой метод, и именно распределение Пуассона.

Итак, если количество испытаний достаточно велико, а вероятность появления события в отдельно взятом испытании весьма мала (0,05-0,1 и меньше), то вероятность того, что в данной серии испытаний событие появится ровно раз, можно приближенно вычислить по формуле Пуассона:
, где

Напоминаю, что ноль факториал , а значит, формула имеет смысл и для .

Вместо «лямбды» также используют букву «а».

В новом микрорайоне поставлено 10000 кодовых замков на входных дверях домов. Вероятность выхода из строя одного замка в течение месяца равна 0,0002. Найти вероятность того, что за месяц откажет ровно 1 замок.

Утопичная, конечно, задача, но что делать – решаем🙂

В данном случае количество «испытаний» велико, а вероятность «успеха» в каждом из них – мала: , поэтому используем формулу Пуассона:

Вычислим:
– по существу, это среднеожидаемое количество вышедших из строя замков.

Таким образом:
– вероятность того, что за месяц из строя выйдет ровно один замок (из 10 тысяч).

Ответ:

С технической точки зрения этот результат можно получить несколькими способами, расскажу о них в историческом ракурсе:

1) С помощью специальной таблицы, которая до сих пор встречается во многих книгах по терверу. В данную таблицу сведены различные значения и соответствующие им вероятности. Табулирование обусловлено тем, что в своё время не существовало бытовых калькуляторов, на которых можно было бы подсчитать значения экспоненциальной функции. Отсюда, кстати, идёт традиция округлять вычисления до 4 знаков после запятой – как в стандартной таблице.

2) С помощью прямого вычисления на микрокалькуляторе (прогресс!).

3) С помощью стандартной экселевской функции:
=ПУАССОН(m; лямбда; 0)
в данной задаче вбиваем в любую ячейку Экселя =ПУАССОН(1; 2; 0) и жмём Enter.

Следует отметить, что развитие вычислительной техники фактически отправило в историю методы Лапласа, да и рассматриваемый метод тоже – по той причине, что ответ легко вычислить более точно по формуле Бернулли:

Здесь я использовал функцию БИНОМРАСП, о которой неоднократно упоминал ранее.

Но формула Пуассона, тем не менее, даёт очень крутое приближение:
– с погрешностью только на 9 знаке после запятой!

Впрочем, это всё лирика, решать-то всё равно нужно по формуле Пуассона:

Завод отправил в торговую сеть 500 изделий. Вероятность повреждения изделия в пути равна 0,003. Найти вероятность того, что при транспортировке будет повреждено: а) ни одного изделия, б) ровно три изделия, в) более трех изделий.

Решение: используем формулу Пуассона:

В данном случае:
– среднеожидаемое количество повреждённых изделий

а)
– вероятность того, что все изделия дойдут в целости и сохранности. Ничего не украдут, одним словом 🙂

б)
– вероятность того, что в пути будут повреждены ровно 3 изделия из 500.

в)
А тут всё немножко хитрее. Сначала найдём – вероятность того, что в пути повредятся не более трёх изделий. По теореме сложения вероятностей несовместных событий:

Само собой, ручками это считать надоест, и поэтому я добавил в свой расчётный макет автоматическое построение распределения Пуассона (см. Пункт 7) – пользуйтесь на здоровье.

По теореме сложения вероятностей противоположных событий:
– вероятность того, что при доставке будет повреждено более 3 изделий.

Ответ: а) , б) , в)

Вероятность изготовления бракованных деталей при их массовом производ­стве равна . Определить вероятность того, что в партии из 800 деталей будет: а) ровно 2 бракованные, б) не более двух.

Решение и ответ в конце урока.

Встречаются и другие формулировки условия. Так, в предложенной задаче может идти речь о том, что производственный брак составляет 0,1% или «в среднем 1 деталь на каждую тысячу». Бывает и дано готовое значение «лямбда», например: «В стандартной партии из 800 деталей брак в среднем составляет 0,8 деталей. Найти вероятность того, что в очередной партии…».

В этой связи ни в коем случае не отключаем голову – даже в таких простых примерах!

А теперь о самом распределении Пуассона. Случайная величина , распределённая по этому закону, принимает бесконечное и счётное количество значений , вероятности появления которых определяются формулой:

Или, если расписать подробно:

Вспоминая разложение экспоненты в ряд, легко убедиться, что:

В теории установлено, что математическое ожидание пуассоновской случайной величины равно и дисперсия – тому же самому значению: .

Обратите внимание, что во всех вышеприведённых заданиях мы лишь ПОЛЬЗОВАЛИСЬ распределением Пуассона для приближенного расчёта вероятностей, в то время как ТОЧНЫЕ значения следовало находить по формуле Бернулли, т.е., там имело место биномиальное распределение.

И следующие две задачи принципиально отличаются от предыдущих:

Случайная величина подчинена закону Пуассона с математическим ожиданием . Найти вероятность того, что данная случайная величина примет значение, меньшее, чем ее математическое ожидание.

Отличие состоит в том, что здесь речь идёт ИМЕННО о распределении Пуассона.

Решение: случайная величина принимает значения с вероятностями:

По условию, , и тут всё просто: событие состоит в трёх несовместных исходах:

вероятность того, что случайная величина примет значение, меньшее, чем ее математическое ожидание.

Ответ:

Аналогичная задача на понимание:

Случайная величина подчинена закону Пуассона с математическим ожиданием . Найти вероятность того, что данная случайная величина примет положительное значение.

Решение и ответ в конце урока.

Помимо приближения биномиального распределения (Примеры 1-3), распределение Пуассона нашло широкое применение в теории массового обслуживания для вероятностной характеристики простейшего потока событий. Постараюсь быть лаконичным:

Пусть в некоторую систему поступают заявки (телефонные звонки, приходящие клиенты и т.д.). Поток заявок называют простейшим, если он удовлетворяет условиям стационарности, отсутствия последствий и ординарности. Стационарность подразумевает то, что интенсивность заявок постоянна и не зависит от времени суток, дня недели или других временнЫх рамок. Иными словами, не бывает «часа пик» и не бывает «мёртвых часов». Отсутствие последствий означает, что вероятность появления новых заявок не зависит от «предыстории», т.е. нет такого, что «одна бабка рассказала» и другие «набежали» (или наоборот, разбежались). И, наконец, свойство ординарности характеризуется тем, что за достаточно малый промежуток времени практически невозможно появление двух или бОльшего количества заявок. «Две старушки в дверь?» – нет уж, увольте, рубить удобнее по порядку.

Итак, пусть в некоторую систему поступает простейший поток заявок со средней интенсивностью заявок в некоторую единицу времени (минуту, час, день или в любую другую). Тогда вероятность того, что за данный промежуток времени, в систему поступит ровно заявок, равна:

Звонки в диспетчерскую такси представляет собой простейший пуассоновский поток со средней интенсивностью 30 вызовов в час. Найти вероятность того, что: а) за 1 мин. поступит 2-3 вызова, б) в течение пяти минут будет хотя бы один звонок.

Решение: используем формулу Пуассона:

а) Учитывая стационарность потока, вычислим среднее количество вызовов за 1 минуту:
вызова – в среднем за одну минуту.

По теореме сложения вероятностей несовместных событий:
– вероятность того, что за 1 минуту в диспетчерскую поступит 2-3 вызова.

б) Вычислим среднее количество вызов за пять минут:

По формуле Пуассона:
– вероятность того, что в течение 5 минут не будет ни одного звонка.

По теореме сложения вероятностей противоположных событий:
– вероятность того, что в течение 5 минут будет хотя бы один вызов.

Ответ: а) , б)

Заметьте, что, несмотря на конечное количество возможных звонков (а оно в принципе конечно), здесь имеет место именно распределение Пуассона, а не какое-то другое.

Для самостоятельного решения:

Среднее число автомобилей, проходящих таможенный досмотр в течение часа, равно 3. Найти вероятность того, что: а) за 2 часа пройдут досмотр от 7 до 10 автомобилей; б) за полчаса успеет пройти досмотр только 1 автомобиль.

Решение и ответ в конце урока.

Наверное, многие знают, что теория массового обслуживания – это обширный и очень интересный раздел прикладной математики, и сейчас мы познакомились с простейшей его задачей.

Дополнительные примеры на распределение и формулу Пуассона можно найти в тематической pdf-книге, и я предлагаю вам ознакомиться с ещё одной популярной вещью – Гипергеометрическим распределением вероятностей.

Приятного и полезного чтения!

Решения и ответы:

Пример 3. Решение: используем формулу Пуассона:
, в данном случае:

а) – вероятность того, что в данной партии окажется ровно 2 бракованные детали.
б) По теореме сложения вероятностей несовместных событий:

– вероятность того, что в данной партии окажется не более 2 бракованных изделий.

Пример 5. Решение: случайная величина принимает значения с вероятностями . По условию, .
Найдём вероятность того, что случайная величина примет нулевое значение:

По теореме сложения вероятностей противоположных событий:
– вероятность того, что случайная величина примет положительное значение

Пример 7. Решение: предполагая поток простым, используем формулу Пуассона:

а) Вычислим – среднее количество автомобилей, проходящих таможенный досмотр, в течение 2 часов.
По теореме сложения вероятностей несовместных событий:

– вероятность того, что за 2 часа досмотр пройдут от 7 до 10 автомобилей

б) Вычислим – среднее количество автомобилей, проходящих досмотр, за 1/2 часа.
По формуле Пуассона:
– вероятность того, что за полчаса таможенный досмотр пройдёт только один автомобиль.

Автор: Емелин Александр

(Переход на главную страницу)

«Всё сдал!» — онлайн-сервис помощи студентам

Статистические выводы

Оценка параметров

Учитывая выборку из n измеренных значений для i = 1, . n , мы хотим оценить значение параметра λ пуассоновской популяции, из которой была взята выборка. Максимального правдоподобия оценка k я ∈ < 0 , 1 , . . . > <\ Displaystyle к_ <я>\ в \ <0,1, . \>>

Поскольку каждое наблюдение имеет математическое ожидание λ, то же самое означает выборочное среднее. Следовательно, оценка максимального правдоподобия является несмещенной оценкой λ. Это также эффективная оценка, поскольку ее дисперсия достигает нижней границы Крамера – Рао (CRLB). Следовательно, это несмещенная минимальная дисперсия . Также можно доказать, что сумма (и, следовательно, выборочное среднее, поскольку оно является взаимно однозначной функцией суммы) является полной и достаточной статистикой для λ.

Чтобы доказать достаточность, мы можем использовать теорему факторизации . Рассмотрим разделение функции масс вероятности совместного распределения Пуассона для выборки на две части: одну, которая зависит исключительно от выборки (называемой ), и другую, которая зависит от параметра и выборки только через функцию . Тогда это достаточная статистика для . Икс <\ displaystyle \ mathbf > час ( Икс ) <\ Displaystyle ч (\ mathbf <х>)> λ <\ displaystyle \ lambda>Икс <\ displaystyle \ mathbf > Т ( Икс ) <\ Displaystyle Т (\ mathbf <х>)> Т ( Икс ) <\ Displaystyle Т (\ mathbf <х>)> λ

Чтобы найти параметр λ, который максимизирует функцию вероятности для пуассоновской популяции, мы можем использовать логарифм функции правдоподобия:

Возьмем производную по λ и сравним с нулем:

Решение относительно λ дает стационарную точку.

Итак, λ — это среднее значение k i . Получение знака второй производной от L в стационарной точке определит, что это за экстремальное значение λ .

Оценка второй производной в стационарной точке дает:

что является отрицательным значением в n раз обратным среднему значению k i . Это выражение отрицательно, когда среднее положительное. Если это выполнено, то стационарная точка максимизирует функцию вероятности.

Для выполнения этого равенства должно быть 0. Это следует из того факта, что ни один из других членов не будет равен 0 для всех в сумме и для всех возможных значений . Следовательно, поскольку все подразумевает это , и статистика оказалась полной. г ( т ) <\ displaystyle g (t)>т <\ displaystyle t>λ <\ displaystyle \ lambda>E ( г ( Т ) ) знак равно 0 <\ Displaystyle Е (г (Т)) = 0>λ <\ displaystyle \ lambda>п λ ( г ( Т ) знак равно 0 ) знак равно 1 <\ Displaystyle P _ <\ lambda>(г (Т) = 0) = 1>

Доверительный интервал

Доверительный интервал для среднего распределения Пуассона можно выразить с помощью соотношения между совокупными функциями распределения Пуассона и х-квадратом распределениями . Распределение хи-квадрат само по себе тесно связано с гамма-распределением , и это приводит к альтернативному выражению. Учитывая наблюдение k из распределения Пуассона со средним значением μ , доверительный интервал для μ с уровнем достоверности 1 — α равен

где — функция квантиля (соответствующая нижней части хвоста p ) распределения хи-квадрат с n степенями свободы, и — функция квантиля гамма-распределения с параметром формы n и параметром масштаба 1. Этот интервал является « точным » в в том смысле, что вероятность его охвата никогда не меньше номинальной 1 — α . χ 2 ( п ; п ) <\ Displaystyle \ чи ^ <2>(п; п)> F — 1 ( п ; п , 1 ) <\ Displaystyle F ^ <- 1>(п; п, 1)>

Когда квантили гамма-распределения недоступны, было предложено точное приближение к этому точному интервалу (на основе преобразования Уилсона – Хильферти ):

где обозначает стандартное нормальное отклонение с верхней хвостовой частью α / 2 . z α / 2 <\ Displaystyle г _ <\ альфа / 2>>

Для применения этих формул в том же контексте, что и выше (учитывая выборку из n измеренных значений k i, каждое из которых извлечено из распределения Пуассона со средним λ ), можно было бы установить

вычислить интервал для μ = , а затем вывести интервал для λ .

Байесовский вывод

В байесовском выводе , то сопряженные перед для параметра скорости Х распределений Пуассона является гамма — распределение . Позволять

обозначают, что λ распределяется в соответствии с гамма- плотностью g, параметризованной с помощью параметра формы α и параметра обратного масштаба β :

Затем, учитывая ту же выборку из n измеренных значений k i, что и раньше , и априорную гамму ( α , β ), апостериорное распределение имеет вид

Апостериорное среднее E [ λ ] приближается к оценке максимального правдоподобия в пределе as , что непосредственно следует из общего выражения среднего значения гамма-распределения . λ ^ M L E <\ displaystyle <\ widehat <\ lambda>> _ <\ mathrm >> α → 0 , β → 0

Заднее предсказание распределения для одного дополнительного наблюдения является отрицательным биномиальным распределением , иногда называется распределением гаммы-Пуассон.

Одновременная оценка нескольких средних Пуассона

Предположим , что представляет собой набор независимых случайных величин из множества распределений Пуассона, каждый с параметром , и мы хотели бы, чтобы оценить эти параметры. Затем Clevenson и Зидек показывает , что при нормированной квадрате потери ошибки , когда , затем, подобно тому, как в примере Штейна для обычных средств, оценка MLE является недопустимой . Икс 1 , Икс 2 , … , Икс п <\ displaystyle X_ <1>, X_ <2>, \ dots, X_

> п <\ displaystyle p>λ я <\ displaystyle \ lambda _ > я знак равно 1 , … , п <\ Displaystyle я = 1, \ точки, р>L ( λ , λ ^ ) знак равно ∑ я знак равно 1 п λ я — 1 ( λ ^ я — λ я ) 2 <\ displaystyle L (\ lambda, <\ hat <\ lambda>>) = \ sum _ ^

\ lambda _ ^ <- 1>(<\ hat <\ lambda>> _ — \ lambda _ ) ^ <2>> п > 1 <\ displaystyle p> 1>λ ^ я знак равно Икс я <\ displaystyle <\ hat <\ lambda>> _ = X_ >

Закон распределения случайной величины Пуассона

Закон распределения СВ Пуассона вытекает из биномиального закона распределения СВ и относится к дискретному распределению.

В случая малых значений р (то есть при р≤0,1) и большом значении n применяется закон распределения случайной величины Пуассона.

Вероятность того, что случайная величина X примет значение равное k, вычисляется по формуле:

формула Пуассона

Р(Х=k) = Pn(k) = λ k ⋅e -λ /k!

где λ=n⋅p = const

Это выражение описывает плотность вероятности.
Распределение Пуассона в виде гистограммы
Таблица ряда распределения случайной величины X по закону Пуассона:
закон пуассона распределения случайной величин - таблица
Плотность распределения график
График плотности распределения случайной величины, где красным цветом при λ=1 , синим λ=5, зелёным λ=10, оранжевым λ=0.5 и фиолетовым λ=2
Функция распределения определяется равенством:
Функция распределения формула
функция распределения график
График функции распределения случайной величины по закону Пуассона при λ=1 , λ=5, λ=10, λ=0.5 и λ=2
Закон распределения Пуассона связан с редкими событиями, например, число дефектов в производственном процессе, число несчастных случаев и т д. Применяется также системах массового обслуживания.
Параметр распределения равен: λ
Математическое ожидание:
Математическое ожидание формула

M(x) = λ

Дисперсия:

Дисперсия формула

D(x) = λ

Пример
В магазин по продажи холодильников поступает примерно 100 звонков в день. Вероятность того, что закажут холодильник белого цвета 0,09; чёрного — 0,07 и бежевого — 0,03.
Требуется составить закон распределения заказов на покупку холодильников.
Решение
Здесь n=100 и p1=0,09, p2=0,07, p3=0,03.
Так как λ=np, тогда
λ1=9, λ2=7 и λ3=3
Составим таблицу распределения вероятностей при различных значениях k и λ.

k λ1=9 λ2=5 λ3=3
0,000123 0,006738 0,049787
1 0,001111 0,03369 0,149361
2 0,004998 0,084224 0,224042
3 0,014994 0,140374 0,224042
4 0,033737 0,175467 0,168031
5 0,060727 0,175467 0,100819
6 0,09109 0,146223 0,050409
7 0,117116 0,104445 0,021604
8 0,131756 0,065278 0,008102
9 0,131756 0,036266 0,002701
10 0,11858 0,018133 0,00081

На основании этой таблицы построим полигон распределения покупки холодильников.

график закон распределения пример

Насколько публикация полезна?

Нажмите на звезду, чтобы оценить!

Средняя оценка 4 / 5. Количество оценок: 1

Оценок пока нет. Поставьте оценку первым.

1792

Формула Пуассона

Пример №1 . Семена содержат 0.1% сорняков. Какова вероятность при случайном отборе 2000 семян обнаружить 5 семян сорняков?
Решение.
Вероятность р мала, а число n велико. np = 2 5 e -5 /5! = 0.03609
Математическое ожидание: M[X] = λ = 2
Дисперсия: D[X] = λ = 2

Пример №2 . Среди семян ржи имеется 0.4% семян сорняков. Составить закон распределения числа сорняков при случайном отборе 5000 семян. Найти математическое ожидание и дисперсию этой случайной величины.
Решение. Математическое ожидание: M[X] = λ = 0.004*5000 = 20. Дисперсия: D[X] = λ = 20
Закон распределения:

X 1 2 m
P e -20 20e -20 200e -20 20 m e -20 /m!

Пример №3 . На телефонной станции неправильное соединение происходит с вероятностью 1/200. Найдите вероятность того, что среди 200 соединений произойдет:
а) ровно одно неправильное соединение;
б) меньше чем три неправильных соединения;
в) больше чем два неправильных соединения.
Решение. По условию задачи вероятность события мала, поэтому используем формулу Пуассона (15).
а) Задано: n = 200, p = 1/200, k = 1. Найдем P200(1).
Получаем: . Тогда P200(1) ≈ e -1 ≈ 0,3679.
б) Задано: n = 200, p = 1/200, k < 3. Найдем P200(k < 3).
Имеем: a = 1.

в) Задано: n = 200, p = 1/200, k > 2. Найдем P200(k > 2).
Эту задачу можно решить проще: найти вероятность противоположного события, так как в этом случае нужно вычислить меньше слагаемых. Принимая во внимание предыдущий случай, имеем

Рассмотрим случай, когда n является достаточно большим, а p — достаточно малым; положим np = a, где a — некоторое число. В этом случае искомая вероятность определяется формулой Пуассона:

Пример №4 . Вероятность того, что деталь бракованная, равна 0.005. проверяется 400 деталей. Укажите формулу вычисления вероятности того, что больше 3 деталей оказались с браком.

Пример №5 . Вероятность появления бракованных деталей при их массовом производстве равна p. определить вероятность того, что в партии из N деталей содержится а) ровно три детали; б) не более трех бракованных деталей.
p=0,001; N = 4500
Решение.
Вероятность р мала, а число n велико. np = 4.5 < 10. Значит случайная величина Х – распределена по Пуассоновскому распределению. Составим закон.
Случайная величина X имеет область значений (0,1,2. m). Вероятности этих значений можно найти по формуле:

Найдем ряд распределения X.
Здесь λ = np = 4500*0.001 = 4.5
P(0) = e — λ = e -4.5 = 0.01111
P(1) = λe -λ = 4.5e -4.5 = 0.04999

Тогда вероятность того, что в партии из N деталей содержится ровно три детали, равна:

Тогда вероятность того, что в партии из N деталей содержится не более трех бракованных деталей:
P(x<3) = P(0) + P(1) + P(2) = 0,01111 + 0,04999 + 0,1125 = 0,1736

Пример №6 . Автоматическая телефонная станция получает в среднем за час N вызовов. Определить вероятность того, что за данную минуту она получит: а) ровно два вызова; б) более двух вызовов.
N = 18
Решение.
За одну минуту АТС в среднем получает λ = 18/60 мин. = 0,3
Считая, что случайное число X вызовов, поступивших на АТС за одну минуту,
подчиняется закону Пуассона, по формуле найдем искомую вероятность

Найдем ряд распределения X.
Здесь λ = 0.3
P(0) = e — λ = e -0.3 = 0.7408
P(1) = λe -λ = 0.3e -0.3 = 0.2222

Вероятность того, что за данную минуту она получит ровно два вызова:
P(2) = 0,03334
Вероятность того, что за данную минуту она получит более двух вызовов:
P(x>2) = 1 – 0,7408 – 0,2222 – 0,03334 = 0,00366

Читайте также:  Макрос для поиска ячеек в Excel с выпадающим списком и условным форматированием

Пример №7 . Рассматриваются два элемента, работающих независимо друг от друга. Продолжительность времени безотказной работы имеет показательное распределение с параметром λ1 = 0,02 для первого элемента и λ2 = 0,05 для второго элемента. Найти вероятность того, что за 10 часов: а) оба элемента будут работать безотказно; б) только Вероятность того, что за 10 часов элемент №1 не выйдет из строя:
Рещение.
P1(0) = e -λ1*t = e -0.02*10 = 0,8187

Вероятность того, что за 10 часов элемент №2 не выйдет из строя:
P2(0) = e -λ2*t = e -0.05*10 = 0,6065

а) оба элемента будут работать безотказно;
P(2) = P1(0)*P2(0) = 0,8187*0,6065 = 0,4966
б) только один элемент выйдет из строя.
P(1) = P1(0)*(1-P2(0)) + (1-P1(0))*P2(0) = 0.8187*(1-0.6065) + (1-0.8187)*0.6065 = 0.4321

Распределение Пуассона

Закон Пуассона можно применять для совокупностей, достаточно больших по объему (n > 100) и имеющих достаточно малую долю единиц, обладающих данным признаком (p < 0,1).
При этом распределение Пуассона можно применить, когда на только не известно значение n – общего числа возможных результатов, но и когда не известно конечное число, которое n может представлять. Там, где есть среднее число случаев наступления события, вероятность наступления события описывается членами разложения:

Распределение Пуассона

Дискретная случайная величина имеет распределение Пуассона с параметром λ, если:

Распределение Пуассона также называется распределением редких событий.

Распределение Пуассона — это дискретное распределение, являющееся одним из важных предельных случаев биномиального распределения.

Это одно из важнейших дискретных вероятностных распределений впервые было исследовано в 1837 г. С.Пуассоном (французский математик, механик и физик, 1781 – 1840 гг.), именем которого оно и называется.

Пуассоновская модель П() обычно описывает схему редких событий: при некоторых предположениях о характере процесса появления случайных событий число событий, происшедших за фиксированный промежуток времени или в фиксированной области пространства, часто подчиняется пуассоновскому распределению.

Примерами могут служить число частиц радиоактивного распада, зарегистрированных счетчиком в течении некоторого времени t, число вызовов, поступивших на телефонную станцию за время t, число дефектов в куске ткани или в ленте фиксированной длины, число изюминок в кексе и т.д.

Наконец, распределение Пуассона дает хорошую аппроксимацию биномиального распределения для больших значений n и малых значений р: Bi(n, p) П(np), если np не велико. Это свойство позволяет значительно упростить вычисления в биномиальной модели при указанных условиях.

Распределение Пуассона моделирует случайную величину, представляющую собой число событий, произошедших за фиксированное время, при условии, что данные события происходят с некоторой фиксированной средней интенсивностью и независимо друг от друга.

Это распределение интенсивно используется в картах контроля качества, теории массового обслуживания, телекоммуникации, медицинской статистике и т. д.

При росте n, малом р и фиксированном значении произведения np=λ > 0 биномиальное распределение сходится к распределению Пуассона.

Функции распределения ПУАССОН и ПУАССОН.РАСП в Excel

Регистрация на форуме тут, о проблемах пишите сюда — alarforum@yandex.ru, проверяйте папку спам! Обязательно пройдите восстановить пароль.

Поиск по форуму
Расширенный поиск
К странице.
Страница 1 из 2 1 2 Следующая >

Добрый день! Думаю данный вопрос будет интересен не только начинающим, но и программистам хорошего уровня.

Собственно моя задача: мне необходимо написать функцию распределения Пуассона, полностью аналогичную функции poissrnd() в Matlab. Написать из псевдокода не получается, книгу Кнут(а), смотрел, не удается написать, и там похоже не то распределение. Искал и перерыл тысячи иностранных и русских источников, но не нашел ничего подходящего, ни одной функции, которая принимала бы на вход два значения — М и lambda.

Помогите пожалуйста, моих знаний не хватает на написание такой функции.
Пишу в Dev c++, просьба расписать, как подключать необходимые библиотеки, если это будет необходимо для решения задачи, и где их брать (конкретно именно этой задачи, так я более-менее ориентируюсь в среде разработки Dev c++).

Дискретное составное распределение Пуассона

Когда являются неотрицательными целочисленными случайными величинами iid с , тогда это составное распределение Пуассона называется дискретным составным распределением Пуассона (или распределением Пуассона заикания). Мы говорим, что дискретная случайная величина, удовлетворяющая характеристике производящей функции вероятности Икс 1 , Икс 2 , Икс 3 , … <\ Displaystyle X_ <1>, X_ <2>, X_ <3>, \ точки> п ( Икс 1 знак равно k ) знак равно α k , ( k знак равно 1 , 2 , … ) <\ Displaystyle P (X_ <1>= k) = \ alpha _ , \ (k = 1,2, \ ldots)> Y

имеет дискретное составное распределение Пуассона (ДКП) с параметрами , которое обозначается ( α 1 λ , α 2 λ , … ) ∈ р ∞ ( ∑ я знак равно 1 ∞ α я знак равно 1 , α я ≥ 0 , λ > 0 ) <\ displaystyle (\ alpha _ <1>\ lambda, \ alpha _ <2>\ lambda, \ ldots) \ in \ mathbb ^ <\ infty>\ left (\ sum _ ^ < \ infty>\ alpha _ = 1, \ alpha _ \ geq 0, \ lambda> 0 \ right)>

Более того, если , мы говорим, имеет дискретное сложное распределение Пуассона порядка . Когда , DCP становится распределение Пуассона и распределение Эрмита , соответственно. Когда DCP становится тройным распределением заикания-Пуассона и четырехкратным распределением Пуассона заикания, соответственно. Другие частные случаи включают: геометрическое распределение сдвига , отрицательное биномиальное распределение , геометрическое распределение Пуассона, распределение Неймана типа A, распределение Луриа – Дельбрюка в эксперименте Лурия – Дельбрюк . Для более частного случая DCP см. Обзорный документ и ссылки в нем. Икс ∼ DCP ( λ α 1 , … , λ α р ) <\ displaystyle X \ sim <\ operatorname > (\ lambda <\ alpha _ <1>>, \ ldots, \ lambda <\ alpha _ >)> Икс <\ displaystyle X>р <\ displaystyle r>р знак равно 1 , 2 <\ displaystyle r = 1,2>р знак равно 3 , 4

Характеристика Феллера состояний соединения распределения Пуассона , что неотрицательное целое число значных с.в. является бесконечно делимым тогда и только тогда , когда ее распределение является дискретным Сложное распределение Пуассона. Можно показать, что отрицательное биномиальное распределение является дискретным безгранично делимым , т. Е. Если X имеет отрицательное биномиальное распределение, то для любого положительного целого числа n существуют дискретные iid случайные величины X 1 , . X n , сумма которых имеет Такое же распределение , что X имеет. Геометрическое распределение сдвига представляет собой дискретное сложное распределение Пуассона, поскольку это тривиальный случай отрицательного биномиального распределения . Икс

Это распределение может моделировать поступление пакетов (например, в массовых очередях ). Дискретное составное распределение Пуассона также широко используется в актуарной науке для моделирования распределения общей суммы требования.

Когда некоторые из них отрицательны, это дискретное псевдосложное распределение Пуассона. Мы определяем, что любая дискретная случайная величина, удовлетворяющая характеристике производящей функции вероятности α k <\ displaystyle \ alpha _ > Y

Функции распределения ПУАССОН и ПУАССОН.РАСП в Excel

См. файл НОРМАЛЬНОЕ.XLS ( шаблон и решение ) и рис. 71 .

для вычисления вероятностей «более чем» используется вычитание из 1;

для вычисления вероятностей «между» используется вычитание значений, выдаваемых функциями;

для вычислений границ с вероятностями попадания «справа» используется дополнительная вероятность до единицы.

Вероятности стандартизованных диапазонов

Мы уже сталкивались в нашем курсе с диапазонами, построенными на стандартном отклонении (в примере с индексом Доу-Джонса из темы 2). Теперь становится понятным, что они связаны с нормальным распределением.

Вероятности Р (μ — kσ < X < μ + kσ) можно вычислить с помощью функций =НОРМСТРАСП(k) — НОРМСТРАСП(-k) .

Подставляя вместо k последовательно 1, 2 и 3, получим P(-1 < Z < 1) = 0,6827; P(-2 < Z < 2) = 0,9545; P(-3 < Z < 3) = 0,9973.

Для нормального распределения практически все значения лежат в радиусе трех стандартных отклонений от математического ожидания (рис. 72 ).

Отдел по работе с персоналом крупной коммуникационной компании «Ростелеком» пересматривает свою стратегию найма. Каждый кандидат проходит экзамен, результаты которого учитываются при решении вопроса о найме. Обработка результатов показала, что количество баллов имеет приблизительно нормальное распределение с математическим ожиданием 525 и стандартным отклонением 55.

На первом шаге всех делят на три категории: автоматически зачисляемые (более 600 баллов), автоматически не зачисляемые (менее 425 баллов) и те, с кем проводится второй тур. Менеджер по персоналу хочет оценить процент по категориям. Он также хочет вычислить новые границы, при которых автоматически отсекалось бы 10% и принималось бы 15%.

См. файл ПЕРСОНАЛ.XLS ( шаблон и решение ) и рис. 73 . Вероятность автоматического приема вычисляется в В10 по формуле =1-НОРМРАСП(B7;Среднее;СтОткл;1) .

Вероятность автоматического отклонения вычисляется в В11 по формуле =НОРМРАСП(B8;Среднее;СтОткл;1) .

Новые границы отсечений находим в ячейках В17 и В18 с помощью формул = НОРМОБР(1-B14;Среднее;СтОткл) , = НОРМОБР(B15;Среднее;СтОткл) .

Клиент инвестирует 10 000 руб. в определенные акции. Исследуя предысторию этих акций и посоветовавшись со своим брокером, он приходит к выводу, что доходность удовлетворяет нормальному закону с математическим ожиданием 10% и стандартным отклонением 4%. Доходы от акций будут обложены налогом по ставке 33%. Вычислим вероятность того, что в качестве налогов будет уплачено, по крайней мере, 400 руб. Вычислим 90%-ю верхнюю границу для чистого дохода.

Вид модели представлен на рис. 74 .

См. файл НАЛОГИ.XLS ( шаблон и решение ). Налоги составляют 0,33(10000X)=3300X > 400 или X > 4/33, где Х — величина доходности.

Для вычисления вероятности данного события в ячейку D8 введем формулу =1 — НОРМРАСП(400/(Сумма*Ставка);Среднее;СтОткл;1) .

Для ответа на второй вопрос необходимо найти x (чистый доход) из уравнения Р(X < x/6700) = 0,90, где 6700 = 10000 • (1 — 0,33).

Это второе (после нормального) по важности распределение в статистике. Оно представляет собой дискретное распределение и возникает, по крайней мере, в ситуациях двух типов:

делается выборка из совокупности, состоящей из элементов двух типов (например, мужчины и женщины);

рассматривается цепочка экспериментов, имеющие только два исхода.

Представим серию испытаний, каждое из которых имеет два возможных исхода (успех, неуспех). Вероятность успеха р , а вероятность неуспеха (1 — р) соответственно. Число испытаний — n . Пусть X — случайная величина равная количеству успешных испытаний в серии из n испытаний. Тогда X имеет биномиальное распределение с параметрами n и p .

Нас интересует вероятность каждого возможного значения случайной величины Х, то есть P(X = k). Эту вероятность можно вычислить с помощью функции БИНОМРАСП (BINOMDIST) . Рассмотрим параметры функции = БИНОМРАСП(k;n;p;cum) .

Если параметр cum равен 1, то получаем вероятность «не более k успехов» , а если cum равен 0, то получаем вероятность «ровно k успехов» .

Используется также функция КРИТБИНОМ , которая возвращает наименьшее значение «количества успехов», для которого вероятность события «не более данного количества успехов» больше или равна заданному значению.

Предположим, что 100 батареек вставлены в 100 фонариков по одной в каждый. После 8 ч. работы мы предполагаем, что батарейка работает с вероятностью 0,6 и не работает с вероятностью 0,4. Успех в данном случае — это работа батарейки после 8 ч. Найдем вероятности следующих событий:

1) успехов ровно 58;

2) не более 65 успехов;

3) менее 70 успехов;

4) по крайней мере, 59 успехов;

5) более 65 успехов;

6) между 55 и 65 успехов (включительно);

7) ровно 40 неуспехов;

8) по крайней мере, 35 неуспехов;

9) менее 42 неуспехов.

Во многих управленческих задачах распределение Пуассона играет важную роль. Например, вероятностные модели управления запасами, моделирование очередей, вероятностные модели надежности и т.д.

Найдем также наименьшее значение «количества успехов», для которого вероятность события «не более данного количества успехов» больше или равна 0,95.

Смотрите файл БИНОМИАЛЬНОЕ.XLS ( шаблон и решение ) и рис. 75 .

Первые шесть вопрос решаются с использованием следующих вероятностей:

3) P(X < 70) = P(X ≤ 69);

4) P(X ≥ 59) = 1 — P(X < 59) = 1 — P(X ≤ 58);

5) P(X > 65) = 1 — P(X ≤ 65);

6) P(55 ≤ X ≤ 65) = P(X ≤ 65) — P(X ≤ 54).

Расчеты по этим формулам делаются в ячейках В7 — В12 с помощью функции БИНОМРАСП (рис. 75).

Для ответа на вопросы 7—9 достаточно иметь в виду, что количество «неудач» также имеет биномиальное распределение с параметрами n и (1-р) .

Нахождение наименьшего значения «количества успехов» можно провести двумя способами — методом подбора (ячейки B21:B26 ), или с помощью функции КРИТБИНОМ (ячейка В28 ).

Математическое ожидание и стандартное отклонение для биномиального распределения

Математическое ожидание биномиального распределения вычисляется по формуле :

Стандартное отклонение биномиального распределения вычисляется по формуле :

Биномиальное распределение в контексте выборок

Имеется некоторая совокупность, состоящая из N элементов двух типов, например, женщины и мужчины. Пусть А — количество мужчин, а В — количество женщин. Тогда А + В = N . Производится случайная выборка размера n . Будет ли количество выбранных мужчин подчиняться биномиальному закону распределения с параметрами n и p = A / N .

Ответ на этот вопрос зависит от способа проведения выборки.

Если выбираемый объект снова возвращается в совокупность и может быть выбран повторно, то такой способ организации выборки назовем выборка с возвратами . В этом случае распределение будет биномиальным .

Если же выбираемый объект не возвращается в совокупность и не может быть выбран повторно, то такой способ организации выборки назовем выборка без возвратов . В этом случае распределение не будет биномиальным. Такое распределение носит название гипергеометрического .

При малых значениях n по отношению к N (например, не более 10%) гипергеометрическое распределение близко к биномиальному.

Приближение биномиального распределения с помощью нормального

Если значение n достаточно велико, а значение р не очень близко к 0 или 1, то график плотности распределения биномиального распределения напоминает график для нормального. См. рис. 76 для значений n = 30 и p = 0,4.

Может быть предложено следующее правило. Если np > 5 и n(1 — p) > 5, то биномиальное распределение можно приблизить нормальным с математическим ожиданием np и стандартным отклонением .

Практически это полезно с той точки зрения, что можно применять правила областей.

Биномиальное распределение часто применяется в бизнес-расчетах.

Покупатели супермаркета «Перекресток» тратят на покупки различные суммы. Анализ данных показал, что суммы покупок распределены по нормальному закону с математическим ожиданием 85 руб. и стандартным отклонением 30 руб. Если предположить, что в некоторый день магазин посещает 500 покупателей, то вычислите математическое ожидание и стандартное отклонение для количества покупателей, потративших по крайней мере 100 руб. Вычислите также вероятность, что по крайней мере 30% покупателей потратили не менее 100 руб.

Поскольку сумма покупки имеет нормальное распределение, вероятность того, что эта сумма будет не меньше 100 руб., вычисляется с помощью формулы =1-НОРМРАСП (100;НормСреднее;НормСтОткл;1) , размещенной в ячейке В8 . (См. файл ПЕРЕКРЕСТОК.XLS ( шаблон и решение ) и рис. 78 ).

Эта вероятность р используется далее как параметр в биномиальной модели. Математическое ожидание и стандартное отклонение вычисляются по известным формулам в ячейках В16 и В19 .

Для ответа на второй вопрос заметим, что 30% от 500 составляет 150. Тогда искомая величина есть вероятность, что биномиальная величина с параметрами n = 500 и p = 0,309 принимает значение не меньшее 150. Эта вероятность вычисляется с помощью формулы =1-БИНОМРАСП (0,3*КолПокуп-1;КолПокуп;ВерНеМен100;1) в ячейке В23 .

Этот пример в некотором упрощенном варианте показывает расчет стратегии продажи авиабилетов, применяемый авиакомпаниями. Понимая, что определенный процент пассажиров в последний момент откажется от полета, и стремясь избежать в этом случае пустых мест, авиакомпании продают несколько большее количество билетов. Мы предположим, что средняя доля отказавшихся от полета пассажиров составляет 5%. Другими словами, каждый пассажир независимо от других летит с вероятностью 0,95 и не летит с вероятностью 0,05. Предположим, что число посадочных мест составляет 200. Компания хочет исследовать, как зависят от числа проданных билетов некоторые вероятности. В частности, вероятность того, что полетят более 205 человек; вероятность того, что полетят более 200 человек; вероятность того, что по крайней мере 195 мест будет заполнено; вероятность того, что по крайней мере 190 мест будет заполнено и т.д.

Для решения данной задачи воспользуемся специальной встроенной функцией биномиального распределения БИНОМРАСП (см. файл СВЕРХПРОДАЖА.XLS ( шаблон и решение ). Построим таблицу с одним входным параметром — количеством проданных билетов (ячейка В6 ), в которой будут вычисляться все четыре искомые вероятности (рис. 79 ).

Вычислим искомые вероятности в ячейках ряда 10 с помощью формулы (для ячейки В10 ) =1-БИНОМРАСП (205;КолБилет;1-ВерНеявки;1) .

Для того чтобы видеть вероятности для различных количеств проданных билетов, создадим таблицу для выбранных значений, например 206, 209, 212 и т.д.

Естественно, что с ростом количества проданных билетов растет вероятность отказа некоторым пассажирам, а с уменьшением — вероятность иметь пустые места. Для принятия конкретных решений необходимо привлекать дополнительные финансовые соображения. Можно было бы оценить положительный финансовый эффект от уменьшения числа среднеожидаемых свободных мест и отрицательный финансовый и нефинансовый эффект от возрастания числа пассажиров, оставшихся без места. Далее возможно рассмотрение модели нахождения оптимального баланса.

Во многих управленческих задачах распределение Пуассона играет важную роль. Например, вероятностные модели управления запасами, моделирование очередей, вероятностные модели надежности и т.д.

Распределение Пуассона — это дискретное распределение, принимающее значение 0, 1, 2, …и т.д.

Распределение задается одним положительным параметром λ, который является одновременно и математическим ожиданием, и дисперсией. Примерный вид распределения показан на рис. 80 .

В основном это распределение возникает при оценке количества событий, происходящих за определенный промежуток времени. Вот серия типичных примеров .

Менеджер банка изучает времена прихода клиентов. Количество клиентов, пришедших в течение часа, имеет распределение Пуассона, где λ — среднее ожидаемое количество клиентов в час.

Устройство использует батарейки. Если батарейка выходит из строя, ее сразу заменяют другой (устройство работает непрерывно). Количество батареек, вышедших из строя за месяц, имеет распределение Пуассона, где λ — среднее ожидаемое количество батареек, вышедших из строя за месяц.

Мастера интересует количество запчастей определенного типа, потребляемых в течение недели. Количество запросов на эту деталь имеет распределение Пуассона, где λ — среднее ожидаемое количество запрашиваемых деталей.

Распределение Пуассона часто используется для описания количества дефектов на некоторой площади. Например, количество дефектов покраски на капоте автомобиля.

Для расчета вероятностей распределения Пуассона в Excel используется функция ПУАССОН (POISSON) . Рассмотрим параметры функции =ПУАССОН(k;λ;cum) .

Если последний параметр данной функции равен 0, то вычисляется Р(Х = k), а если он равен 1, то вычисляется Р(Х ≤ k).

Компания «ТВ-СБЫТ» является региональной базой по продаже телевизоров различных марок. Одна из самых сложных менеджерских задач — это определить величину запаса по каждому типу. С одной стороны, хочется иметь много, чтобы удовлетворить запрос любого покупателя. С другой, излишние запасы — это замороженные деньги и занимаемые складские площади.

Основная трудность возникает из-за неопределенности спроса, который меняется случайным образом из месяца в месяц. Известен только среднемесячный спрос — 17 телевизоров. Приглашенный консультант предполагает использовать вероятностную модель. Как он мог бы действовать?

Исходные данные и решение задачи представлены на рис. 81 .

Пусть Х — это спрос за месяц. Консультант, анализируя данные, построил гистограмму спроса за предыдущие месяцы. Она выглядела приблизительно так, как на рис. 80. Консультант предполагает использовать распределение Пуассона с λ = 17. Далее нужно сравнить вероятности, полученные из реальных данных, и вероятности, полученные из распределения Пуассона (см. файл ТВ-СБЫТ.XLS ( шаблон и решение ). Если нет хорошего соответствия, то нужно подбирать другой параметр или другое распределение.

Нормальное , биномиальное и распределение Пуассона являются наиболее важными в статистических методах обработки данных, однако существует много других: экспоненциальное, Эрланга, логарифмически нормальное, логистическое и т.д. Как выбрать наиболее подходящее?

В общем случае строим гистограмму и выбираем теоретическое распределение, функция плотности распределения вероятностей которого наиболее приближается к данной гистограмме. Для этого применяем, например, программный инструмент BestFit (Decision Tools) .

Супермаркет собрал времена обслуживания более 100 покупателей (см. файл ВРЕМЯ ОБСЛУЖИВАНИЯ.XLS ( шаблон и решение ). Это время изменяется от 40 сек. до 279 сек. со средним значением и медианой около 2,5 мин.

Менеджер хочет определить, соответствуют ли эти данные нормальному распределению, или есть более подходящие распределения?

Войдем в расширение BestFit через панель Пуск . Далее зайдем в Excel , в файл ВРЕМЯ ОБСЛУЖИВАНИЯ.XLS ( шаблон и решение ) и загрузим в буфер массив, содержащий время обслуживания. В табл. 22 представлен фрагмент данных, а также описательная статистика данной выборки.

Таблица 22.
Время обслуживания и обобщающие характеристики

Ограничения распределения Пуассона

Распределение Пуассона представляет собой простую прогнозирующую модель, не учитывающую множество факторов. Полностью игнорируются ситуационные факторы (например, обстоятельства клубов, статус матча и т. д.) и субъективная оценка изменений состава команд во время трансферного окна.

Например, описанный выше пример расчета по формуле распределения Пуассона не учитывает влияние прихода нового тренера Челси Томаса Тухеля на результаты команды.

Также игнорируются такие корреляции, как общепризнанный эффект домашнего поля, который заключается в том, что в определенных матчах команды склонны демонстрировать более высокие или низкие результаты.

Эти факторы имеют особенно большое значение в матчах низших лиг, благодаря чему делающие ставки игроки могут получить преимущество перед букмекерами.

Однако получить преимущество в случае с основными лигами, такими как АПЛ, сложнее, поскольку современные букмекеры располагают ценным опытом и ресурсами в этой сфере.

И последнее, но не менее важное, в эти коэффициенты не включена маржа, закладываемая букмекером, что имеет огромное значение для всего процесса определения валуйной ставки.

Ссылка на основную публикацию