Нормальное распределение

Нормальное распределение имеет плотность::

В этой формуле , фиксированные параметры, – среднее, – стандартное отклонение.

Графики плотности при различных параметрах приведены ниже.

Характеристическая функция нормального распределения имеет вид:

Дифференцируя характеристическую функцию и полагая t = 0, получаем моменты любого порядка.

Кривая плотности нормального распределения симметрична относительно и имеет в этой точке единственный максимум, равный

Параметр стандартного отклонения меняется в пределах от 0 до ∞.

Среднее меняется в пределах от -∞ до +∞.

При увеличении параметра кривая растекается вдоль оси х, при стремлении к 0 сжимается вокруг среднего значения (параметр характеризует разброс, рассеяние).

При изменении кривая сдвигается вдоль оси х (см. графики).

Варьируя параметры и , мы получаем разнообразные модели случайных величин, возникающие в телефонии.

Типичное применение нормального закона в анализе, например, телекоммуникационных данных – моделирование сигналов, описание шумов, помех, ошибок, трафика.

Графики одномерного нормального распределения

Рисунок 1. График плотности нормального распределения: среднее равно 0, стандартное отклонение 1

Рисунок 2. График плотности стандартного нормального распределения с областями, содержащими 68% и 95% всех наблюдений

Рисунок 3. Графики плотностей нормальных распределений c нулевым средним и разными отклонениями (=0.5, =1, =2)

Рисунок 4 Графики двух нормальных распределений N(-2,2) и N(3,2).

Заметьте, центр распределения сдвинулся при изменении параметра .

Замечание

В программе STATISTICA под обозначением N(3,2) понимается нормальный или гауссов закон с параметрами: среднее = 3 и стандартное отклонение =2.

В литературе иногда второй параметр трактуется как дисперсия, т.е. квадрат стандартного отклонения.

Вычисления процентных точек нормального распределения с помощью вероятностного калькулятора STATISTICA

С помощью вероятностного калькулятора STATISTICA можно вычислить различные характеристики распределений, не прибегая к громоздким таблицам, используемым в старых книгах.

Шаг 1. Запускаем Анализ / Вероятностный калькулятор / Распределения.

В разделе распределения выберем нормальное.

Рисунок 5. Запуск калькулятора вероятностных распределений

Шаг 2. Указываем интересующие нас параметры.

Например, мы хотим вычислить 95% квантиль нормального распределения со средним 0 и стандартным отклонением 1.

Укажем эти параметры в полях калькулятора (см. поля калькулятора среднее и стандартное отклонение).

Введем параметр p=0,95.

Галочка «Обратная ф.р». отобразится автоматически. Поставим галочку «График».

Нажмем кнопку «Вычислить» в правом верхнем углу.

Рисунок 6. Настройка параметров

Шаг 3. В поле Z получаем результат: значение квантиля равно 1,64 (см. следующее окно).

Рисунок 7. Просмотр результата работы калькулятора

Далее автоматически появится окно с графиками плотности и функции распределения нормального закона:

Рисунок 8. Графики плотности и функции распределения. Прямая x=1,644485

Рисунок 9. Графики функции нормального распределения. Вертикальные пунктирные прямые- x=-1.5, x=-1, x=-0.5, x=0

Рисунок 10. Графики функции нормального распределения. Вертикальные пунктирные прямые- x=0.5, x=1, x=1.5, x=2

Оценка параметров нормального распределения

Значения нормального распределения можно вычислить с помощью интерактивного калькулятора.

Комбинаторика и вероятность

Ниже вы найдете основные формулы Excel, которые могут применяться при решении вероятностных задач и задач по комбинаторике.

ЧИСЛКОМБ / COMBIN
ФАКТР / FACT СЛЧИС / RAND

Выдает случайное число в интервале от 0 до 1 (равномерно распределенное).

Выдает случайное число в заданном интервале.

Вычисляет отдельное значение биномиального распределения.

Определяет гипергеометрическое распределение.

Вычисляет значение нормальной функции распределения.

Выдает обратное нормальное распределение.

Выдает стандартное нормальное интегральное распределение.

Выдает обратное значение стандартного нормального распределения.

ПЕРЕСТ / PERMUT ВЕРОЯТНОСТЬ / PROB

Определяет вероятность того, что значение из диапазона находится внутри заданных пределов.

Моделирование нормальных случайных величин

Неточные методы моделирования основываются на центральной предельной теореме. Именно, если сложить много независимых одинаково распределённых величин с конечной дисперсией, то сумма будет распределена примерно нормально. Например, если сложить 12 независимых базовых случайных величин, получится грубое приближение стандартного нормального распределения.

Тем не менее, использование точных методов предпочтительно, поскольку у них практически нет недостатков. В частности, преобразование Бокса — Мюллера является точным, быстрым и простым для реализации методом генерации.

Дополнительные ряды распределения

Существуют и другие виды обработки статистических данных. К ним можно отнести:

  • Парето;
  • Полигон частот;
  • Кумуляты и т.д.

Большинство из них можно создавать готовыми шаблонами. Например, для создания «Диаграммы Парето» необходимо сделать следующее.

  1. Выделить таблицу.
  2. Перейти на вкладку «Вставить».
  3. Кликнуть на иконку «Вставка статистической диаграммы».
  4. Выбрать нужную заготовку.

Выбор варианта отображения процента в ячейке

Как ранее уже было сказано, проценты могут выглядеть в виде обычных чисел со знаком %, либо в виде десятичных дробей. В Excel можно выбрать оба варианта отображения ячеек.

Для этого, правой кнопкой мыши щелкните на ячейку с процентным значением, далее выберите пункт “Формат ячеек”.

В открывшемся окне в разделе “Число” можно выбрать “Процентный” формат отображения ячейки и сразу посмотреть образец, как это будет выглядеть.

Также, в этом же разделе можно выбрать “Числовой” формат, при котором проценты будут отображаться в виде десятичных дробей, а само значение процента автоматически будет пересчитано (т.е. вместо 15% будет отображаться 0,15).

Надеемся, данное руководство будет полезно при вычислениях с процентными величинами в Microsoft Excel, как новичку, так и опытному пользователю.

Доверительный интервал для оценки среднего (дисперсия известна) в EXCEL

Построим в MS EXCEL доверительный интервал для оценки среднего значения распределения в случае известного значения дисперсии.

В статье Статистики, выборочное распределение и точечные оценки в MS EXCEL дано определение точечной оценки параметра распределения (point estimator). Однако, в силу случайности выборки, точечная оценка не совпадает с оцениваемым параметром и более разумно было бы указывать интервал, в котором может находиться неизвестный параметр при наблюденной выборке х 1 , x 2 , . х n . Поэтому цель использования доверительных интервалов состоит в том, чтобы по возможности избавиться от неопределенности и сделать как можно более полезный статистический вывод .

Примечание : Процесс обобщения данных выборки , который приводит к вероятностным утверждениям обо всей генеральной совокупности , называют статистическим выводом (statistical inference).

СОВЕТ : Для построения Доверительного интервала нам потребуется знание следующих понятий:

К сожалению, интервал, в котором может находиться неизвестный параметр, совпадает со всей возможной областью изменения этого параметра, поскольку соответствующую выборку , а значит и оценку параметра , можно получить с ненулевой вероятностью. Поэтому приходится ограничиваться нахождением границ изменения неизвестного параметра с некоторой заданной наперед вероятностью.

Определение : Доверительным интервалом называют такой интервал изменения случайной величины , которыйс заданной вероятностью , накроет истинное значение оцениваемого параметра распределения.

Эту заданную вероятность называют уровнем доверия (или доверительной вероятностью ).

Обычно используют значения уровня доверия 90%; 95%; 99%, реже 99,9% и т.д. Например, уровень доверия 95% означает, что дополнительное событие, вероятность которого 1-0,95=5%, исследователь считает маловероятным или невозможным.

Примечание : Вероятность этого дополнительного события называется уровень значимости или ошибка первого рода . Подробнее см. статью Уровень значимости и уровень надежности в MS EXCEL .

Разумеется, выбор уровня доверия полностью зависит от решаемой задачи. Так, степень доверия авиапассажира к надежности самолета, несомненно, должна быть выше степени доверия покупателя к надежности электрической лампочки.

Примечание : Построение доверительного интервала в случае, когда стандартное отклонение неизвестно, приведено в статье Доверительный интервал для оценки среднего (дисперсия неизвестна) в MS EXCEL . О построении других доверительных интервалов см. статью Доверительные интервалы в MS EXCEL .

Распределение Гаусса

Нормальное распределение получило своё название абсолютно справедливо: по статистике, большинство событий происходят именно с вероятностью нормального распределения, но что это значит? Это означает, например, что когда Вы видите на упаковке хлеба обозначение «Вес: 400±16г» — вес батона имеет нормальное распределение со средним значением 400г и стандартным отклонением 16г.

Таблица нормального распределения

Таблица нормального распределения — это затабулированные значения функции нормального распределения.

Для нахождения вероятности события Z можно воспользоваться таблицей нормального распределения ниже. На пересечении строк (n) и столбцов (m) находится значение вероятности n+m.

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.500 0.504 0.508 0.512 0.516 0.520 0.524 0.528 0.532 0.536
0.1 0.540 0.544 0.548 0.552 0.556 0.560 0.564 0.568 0.571 0.575
0.2 0.579 0.583 0.587 0.591 0.595 0.599 0.603 0.606 0.610 0.614
0.3 0.618 0.622 0.625 0.629 0.633 0.637 0.641 0.644 0.648 0.652
0.4 0.655 0.659 0.663 0.666 0.670 0.674 0.677 0.681 0.684 0.688
0.5 0.692 0.695 0.699 0.702 0.705 0.709 0.712 0.716 0.719 0.722
0.6 0.726 0.729 0.732 0.736 0.739 0.742 0.745 0.749 0.752 0.755
0.7 0.758 0.761 0.764 0.767 0.770 0.773 0.776 0.779 0.782 0.785
0.8 0.788 0.791 0.794 0.797 0.799 0.802 0.805 0.808 0.811 0.813
0.9 0.816 0.819 0.821 0.824 0.826 0.829 0.832 0.834 0.837 0.839
1 0.841 0.844 0.846 0.849 0.851 0.853 0.855 0.858 0.860 0.862
1.1 0.864 0.867 0.869 0.871 0.873 0.875 0.877 0.879 0.881 0.883
1.2 0.885 0.887 0.889 0.891 0.892 0.894 0.896 0.898 0.900 0.901
1.3 0.903 0.905 0.907 0.908 0.910 0.911 0.913 0.915 0.916 0.918
1.4 0.919 0.921 0.922 0.924 0.925 0.926 0.928 0.929 0.931 0.932
1.5 0.933 0.934 0.936 0.937 0.938 0.939 0.941 0.942 0.943 0.944
1.6 0.945 0.946 0.947 0.948 0.950 0.951 0.952 0.953 0.954 0.955
1.7 0.955 0.956 0.957 0.958 0.959 0.960 0.961 0.962 0.963 0.963
1.8 0.964 0.965 0.966 0.966 0.967 0.968 0.969 0.969 0.970 0.971
1.9 0.971 0.972 0.973 0.973 0.974 0.974 0.975 0.976 0.976 0.977
2 0.977 0.978 0.978 0.979 0.979 0.980 0.980 0.981 0.981 0.982
2.1 0.982 0.983 0.983 0.983 0.984 0.984 0.985 0.985 0.985 0.986
2.2 0.986 0.986 0.987 0.987 0.988 0.988 0.988 0.988 0.989 0.989
2.3 0.989 0.990 0.990 0.990 0.990 0.991 0.991 0.991 0.991 0.992
2.4 0.992 0.992 0.992 0.993 0.993 0.993 0.993 0.993 0.993 0.994
2.5 0.994 0.994 0.994 0.994 0.995 0.995 0.995 0.995 0.995 0.995
2.6 0.995 0.996 0.996 0.996 0.996 0.996 0.996 0.996 0.996 0.996
2.7 0.997 0.997 0.997 0.997 0.997 0.997 0.997 0.997 0.997 0.997
2.8 0.997 0.998 0.998 0.998 0.998 0.998 0.998 0.998 0.998 0.998
2.9 0.998 0.998 0.998 0.998 0.998 0.998 0.999 0.999 0.999 0.999
3 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.999
3.1 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.999
3.2 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.999 1.000
Таблица 1. Таблица нормального распределения. Красным выделены часто используемые значения при выборе
критической области

Нормальное распределение является наиболее распространенным типом распределения, предполагаемым в техническом анализе фондового рынка и в других видах статистического анализа. Стандартное нормальное распределение имеет два параметра: среднее значение и стандартное отклонение . Для нормального распределения 68% наблюдений находятся в пределах +/- одно стандартное отклонение от среднего значения, 95% находятся в пределах +/- два стандартных отклонения, а 99,7% находятся в пределах + — три стандартных отклонения.

Нормальное распределение

Общим нормальным распределением вероя тностей непрерывной случайной величины Нормальное распределениеназывается распределение с плотностью Нормальное распределение

Нормальное распределение задается двумя параметрами: Нормальное распределениеи Нормальное распределение.

Нормальное распределение

По определениям математического ожидания и дисперсии после выполнения соответствующих интегрирований можно вывести, что для нормального распределения справедливы формулы: Нормальное распределение

По этой ссылке вы найдёте полный курс лекций по высшей математике:

Определение:

Нормальное распределение с параметрами Нормальное распределениеи Нормальное распределениеназывается нормированным; его плотность Нормальное распределение

Поскольку функция является четной, неопределенный интеграл от нее — нечетная функция, и потому вместо функции распределения используется функция Лапласа Нормальное распределениеФункции табулированы Графики плотности нормального распределения для разных значений Нормальное распределениепоказаны на рис. 2.6. Нормальное распределение

Пусть случайная величина X задана плотностью нормального распределения ; тогда вероятность того, что Нормальное распределениепримет значение на интервале Нормальное распределениесогласно формулам равна: Нормальное распределениеПреобразование этой формулы путем введения новой переменной интегрирования Нормальное распределениеприводит к удобной вычислительной формуле Нормальное распределениегде Нормальное распределение— функция Лапласа, определенная по формуле.

Возможно вам будут полезны данные страницы:

Определенный интеграл примеры решений

Область определения функции примеры решения

Пределы функций примеры решения

Производная показательно степенной функции

Модель нормального распределения мотивирована центральной предельной теоремой.

Теория утверждает, что средние значения, рассчитанные из независимых идентично распределенных случайных величин, имеют приблизительно нормальные распределения, независимо от типа распределения, из которого выбираются переменные (при условии, что они имеют конечную дисперсию). Нормальное распределение иногда путают с симметричным распределением. Симметричное распределение — это то, где разделительная линия создает два зеркальных изображения, но фактические данные могут быть двумя горбами или серией холмов в дополнение к кривой колокола, которая указывает на нормальное распределение.

Нормальное распределение

Примеры с решением

Пример 1.

Случайная величина распределена по нормальному закону с математическим ожиданием и средним квадратическим отклонением, соответственно равными 10 и 5. Найти вероятность того, что Нормальное распределениепримет значение на интервале (20, 30).

Решение:

Воспользуемся формулой . По условию Нормальное распределение Нормальное распределениеСледовательно, Нормальное распределениеПо табл. 2 приложения находим соответствующие значения функции Лапласа и окончательно получаем: Нормальное распределение

Пример 2.

Магазин продает мужские костюмы. По данным статистики, распределение по размерам является нормальным с математическим ожиданием и средним квадратическим отклонением, соответственно равным 48 и 2. Определить процент спроса на костюмы 50-го размера при условии разброса значений этого размера в интервале (49, 51).

Решение:

По условию задачи Нормальное распределениеИспользуя формулу (2.66), получаем, что вероятность спроса на костюмы 50-го размера в заданном интервале равна: Нормальное распределение

Следовательно, спрос на костюмы 50-го размера составит около 24%, и магазину нужно предусмотреть это в общем объеме закупки.

Нормальное распределение и его числовые характеристики

ДСВ — дискретная случайная величина

НСВ — непрерывная случайная величина.

В этом подразделе мы создадим функцию распределения для каждого типа НСВ и создадим график, выясним числовые свойства этого типа НСВ и узнаем тип НСВ в реальных ситуациях из содержания задачи. вы будете учиться. Наиболее распространенным в природе, экономике, социологии и других науках является нормальное распределение непрерывных случайных величин.

Используя нормальное распределение, вы можете описать плотность вероятности НСВ, когда появляются отклонения от среднего случайного значения из-за различных явлений, действующих независимо друг от друга, но в одинаковой степени.

Чем больше случайных случайных величин добавлено, тем точнее результат. Все эти явления не зависят друг от друга, но, воздействуя на процесс изготовления примерно с одинаковой силой, обусловливают то, что закон, по которому изменяется НСВ (например, размер конкретной детали), описывается нормальным распределением.

Самое точное изготовление детали с заданными размерами — «эталон» — будет соответствовать математическому ожиданию т, разброс фактических значений случайной величины размера детали — понятию дисперсии (точнее — среднеквадратическому отклонению Нормальное распределение). Случайная величина с нормальным распределением существует в интервале Нормальное распределениеи описывается законами: плотности вероятности Нормальное распределениеназываемой «кривой Гаусса» (рис. 2.9, а) Нормальное распределениегде Нормальное распределениеи Нормальное распределение— параметры нормального распределения, причем Нормальное распределениефункции распределения Нормальное распределение(рис. 2.9, б):

Нормальное распределение

Нормальное распределение

Подстановкой Нормальное распределениеинтеграл приводится к виду Нормальное распределение

Поэтому для удобства вводится нечетная функция Нормальное распределение Нормальное распределениеназываемая функцией Лапласа. Функцию Лапласа называют также «интегралом вероятности», или «функцией ошибок». Очевидно, что Нормальное распределение

Математическое ожидание Нормальное распределениеслучайной величины Нормальное распределениераспределенной нормааьно, равно Нормальное распределениедисперсия равна Нормальное распределениепоэтому параметр Нормальное распределение— среднеквадратическое отклонение.

Случайную величину Нормальное распределениераспределенную нормально с параметрами Нормальное распределениеи Нормальное распределениеобозначают Нормальное распределениеНа практике для вычисления значений функции Лапласа используются таблицы, которые приводятся в справочной литературе (табл. П. 3). Вероятность попадания в интервал Нормальное распределениеНСВ, распределенной по нормальному закону, можно найти с помощью функции Лапласа Нормальное распределениепо формуле Нормальное распределение

Величины параметров нормального распределения СВ Нормальное распределениенепосредственно влияют на форму кривой Нормальное распределениепри Нормальное распределениеона принимает максимальное значение, равное Нормальное распределениеПоэтому с увесил личением (уменьшением) Нормальное распределениемаксимальная ордината убывает (возрастает) и кривая становится более пологой, приближаясь к оси Нормальное распределение

Величина математического ожидания Нормальное распределениевлияет на расположение кривой Нормальное распределениеотносительно оси ординат: при возрастании (убывании) Нормальное распределениекривая смещается вправо (влево). Поэтому с помощью подстановки Нормальное распределениеможно получить функцию Нормальное распределениеплотности вероятности, график которой симметричен относительно оси Нормальное распределениеТакая кривая соответствует нормированному закону нормального распределения с параметрами Нормальное распределениеи Нормальное распределениеВеличину Нормальное распределениеназывают стандартно нормальной. Ее функция распределения имеет вид Нормальное распределение

Логарифмически-нормальное распределение

Определение. Непрерывная случайная величина Нормальное распределениеимеет логарифмически-нормальное (сокращенно логнормальное распределение), если ее логарифм подчинен нормальному закону. Так как при Нормальное распределениенеравенства Нормальное распределениеравносильны, то функция распределения логнормального распределения совпадает с функцией нормального распределения для случайной величины Нормальное распределениет.е. в соответствии с Нормальное распределение

Дифференцируя по Нормальное распределениеполучим выражение плотности вероятности для логнормального распределения Нормальное распределение

Нормальное распределение

Можно доказать, что числовые характеристики случайной величины Нормальное распределениераспределенной по логнормальному закону, имеют вид: математическое ожидание Нормальное распределениедисперсия Нормальное распределениемода Нормальное распределениемедиана Нормальное распределениеОчевидно, чем меньше Нормальное распределениетем ближе друг к другу значения моды, медианы и математического ожидания, а кривая распределения — ближе к симметрии.

Если в нормальном законе параметр а выступает в качестве среднего значения случайной величины, то в логнормальном — в качестве медианы. Логнормальное распределение используется для описания распределения доходов, банковских вкладов, цен активов, месячной заработной платы, посевных площадей под разные культуры, долговечности изделий в режиме износа и старения и др.

Нормальное распределение, также известное как распределение Гаусса, является распределением вероятностей , симметричным относительно среднего значения, показывающим, что данные около среднего значения встречаются чаще, чем данные, далекие от среднего значения.

Нормальное распределение

Пример 3.

Проведенное исследование показало, что вклады населения в данном банке могут быть описаны случайной величиной Нормальное распределениераспределенной по логнормальному закону с параметрами Нормальное распределениеНайти: а) средний размер вклада; б) долю вкладчиков, размер вклада которых составляет не менее 1000 ден. ед.; в) моду и медиану случайной величины Нормальное распределениеи пояснить их смысл.

Решение:

а) Найдем средний размер вклада, т.е. Нормальное распределение

б) Доля вкладчиков, размер вклада которых составляет не менее 1000 ден. ед., есть Нормальное распределение

При определении Нормальное распределениевоспользуемся тем, что функция логнормального распределения случайной величины Нормальное распределениесовпадает с функцией нормального распределения случайной величины Нормальное распределениет.е. с учетом имеем:

Нормальное распределение

Теперь Нормальное распределение

(рис. 4.15). Нормальное распределение

в) Вычислим моду случайной величины Нормальное распределение Нормальное распределениет.е. наиболее часто встречающийся банковский вклад равен 280 ден. ед. (точнее, наиболее часто встречающийся элементарный интервал с центром 280 ден. ед., т.е. интервал ( Нормальное распределениеЕсли исходить из вероятностного смысла параметра Нормальное распределениелогнормального распределения, то медиана Нормальное распределениет.е. половина вкладчиков имеют вклады до 530 ден. ед., а другая половина — сверх 530 ден. ед.

Нормальное распределение Нормальное распределение

Присылайте задания в любое время дня и ночи в whatsapp.

  • Готовые заказы по всем предметам
  • Готовые заказы по высшей математике
  • Готовые заказы по физике
  • Готовые заказы по химии
  • Готовые заказы по экономике

Официальный сайт Брильёновой Натальи Валерьевны преподавателя кафедры информатики и электроники Екатеринбургского государственного института.

Все авторские права на размещённые материалы сохранены за правообладателями этих материалов. Любое коммерческое и/или иное использование кроме предварительного ознакомления материалов сайта natalibrilenova.ru запрещено. Публикация и распространение размещённых материалов не преследует за собой коммерческой и/или любой другой выгоды.

Сайт предназачен для облегчения образовательного путешествия студентам очникам и заочникам по вопросам обучения . Наталья Брильёнова не предлагает и не оказывает товары и услуги.

Интерпретация функции плотности вероятности

Вычисляя площадь под кривой P(x) в заданном интервале (скажем, от –3 до +3), мы определяем вероятность того, что результат случайно выбранного измерения попадет в этот интервал.

Для практических целей мы можем интерпретировать P(x) как вероятность того, что результат случайно выбранного измерения будет приблизительно равен определенному значению.

Например, предположим, что функция плотности вероятности, показанная выше, соответствует гистограмме, которую мы сгенерировали путем измерения напряжения сигнала датчика (в милливольтах). Все значения были округлены до ближайшего милливольта. Среднее значение составило 0 В, а стандартное отклонение было равно 5 мВ.

Мы рассчитали гауссово значение P(x), используя приведенную выше формулу, и построили график P(x), чтобы получить кривую, которая является непрерывным математическим представлением распределения измеренных напряжений датчика. Теперь мы смотрим на график и видим, что значение 6 мВ соответствует P(x) = 0,04, что указывает на то, что существует 4%-ная вероятность того, что случайно выбранное измерение напряжения даст в результате приблизительно 6 мВ.

Я считаю полезным думать о функции плотности вероятности таким образом, но помните, что эта интерпретация неверна со строго математической точки зрения. Функция плотности вероятности является непрерывной, и, следовательно, вероятность отлична от нуля только в интервале, а не в одном точном значении на горизонтальной оси.

Практикум по теории систем и системному анализу для студентов бакалавриата по направлениям

Нормальное распределение (рис. 2) является теоретической моделью случайной величины, представляющей собой сумму константы с бесконечно большим количеством независимых случайных величин (помех), распределённых по произвольным законам на интервале (–; ). Данная константа равна математическому ожиданию нормально распределённой случайной величины.

Функция плотности вероятности нормального распределения:

где x — значение случайной величины,  — её математическое ожидание,  — среднее квадратическое отклонение, e  2,7182818 — основание натурального логарифма.

Функция нормального распределения не выражается через элементарные функции и вычисляется с использованием численных методов интегрирования (например, метода трапеций). Математическая запись:

В Excel плотность распределения вероятности нормального распределения для значения, хранящегося в ячейке Значение, вычисляется с помощью формулы

где Средняя и Дисперсия — имена ячеек, содержащих соответствующие значения. Значение функции нормального распределения (вероятности того, что нормально распределённое случайное значение не превысит указанную величину) вычисляется с помощью формулы

Определить величину, которую с заданной вероятностью не превысит нормально распределённое случайное значение, можно с помощью формулы

где Вероятность — имя ячейки, содержащей требуемое значение вероятности.

Рис. 2. Графики нормального распределения.

В программе MathCad те же вычисления могут быть выполнены с помощью формул

где Значение, Средняя, Дисперсия и Вероятность — имена соответствующих переменных.

Равномерное распределение

Равномерное распределение (рис. 3) не характерно для случайных величин, описывающих экономические, социальные и природные процессы 1 . Однако оно может оказаться подходящим приближением к реальному (неизвестному) распределению при следующих условиях:

диапазон вариации случайной величины x заключён между значениями a и b , каждое из которых имеет интерпретацию в терминах исследуемого процесса (подобно тому, как температура воды при атмосферном давлении может быть распределена между 0 и 100°C);

среднее и модальное значения отличаются от медианы ( a + b )/2 несущественно;

дисперсия исследуемой случайной величины отличается от величины ( b – a ) 2 /12 несущественно;

на гистограмме эмпирического распределения отсутствуют выраженные вершины.

Рис. 3. График равномерного распределения.

Обычно равномерное распределение оказывается приемлемой моделью только при малом числе наблюдений случайной величины. Принятие гипотезы о равномерном распределении, как правило, означает недостаточную степень изученности моделируемой случайной величины, но может оказаться лучшей гипотезой из всех, которые не могут быть отвергнуты на имеющихся опытных данных.

Функция плотности вероятности равномерного распределения:

где x — значение случайной величины, a и b — границы множества её значений.

Функция равномерного распределения:

Математическое ожидание равномерно распределённой случайной величины равно ( a + b )/2; дисперсия — ( b – a ) 2 /12.

Треугольное распределение

Треугольное распределение (рис. 4) не характерно для случайных величин, описывающих экономические, социальные и природные процессы 1 . Однако оно может оказаться подходящим приближением к реальному распределению при следующих условиях:

диапазон вариации случайной величины x заключён между значениями a и b , каждое из которых имеет интерпретацию в терминах исследуемого процесса (подобно тому, как температура воды при атмосферном давлении может быть распределена между 0 и 100°C);

есть основания считать, что при x  a и при x  b плотность вероятности стремится к нулю;

известно модальное значение случайной величины, равное c ;

среднее значение отличается от величины ( а + b + c )/3 несущественно;

дисперсия исследуемой случайной величины отличается от величины

Обычно треугольное распределение оказывается приемлемой моделью только при малом числе наблюдений случайной величины. Принятие гипотезы о треугольном распределении, как правило, означает недостаточную степень изученности моделируемой случайной величины, но может оказаться лучшей гипотезой из всех, которые не могут быть отвергнуты на имеющихся опытных данных.

Рис. 4. График треугольного распределения.

Функция плотности вероятности равномерного распределения:

где x — значение случайной величиныˆ, a и b — границы множества её значений, c — модальное (наиболее часто встречающееся) значение.

Функция треугольного распределения:

Математическое ожидание случайной величины, распределённой по треугольному закону, равно ( a + b + с )/3; дисперсия составляет

Экспоненциальное распределение

Экспоненциальное распределение (рис. 5) является теоретической моделью случайной величины, представляющей собой время, проходящее между независимыми однородными случайными событиями, вероятность наступления которых в единицу времени постоянна. Эта величина распределена на интервале [0; ). Помимо области определения, признаком экспоненциального распределения является отсутствие существенного различия между средним значением случайной величины и её среднеквадратическим отклонением.

Экспоненциальное распределение является частным случаем гамма-распределения.

Функция плотности вероятности экспоненциального распределения:

где x — значение случайной величины,  — её математическое ожидание, e  2,7182818 — основание натурального логарифма.

Функция экспоненциального распределения:

В Excel плотность распределения вероятности экспоненциального распределения для значения, хранящегося в ячейке Значение, вычисляется с помощью формулы

где Средняя и Дисперсия — имена ячеек, содержащих соответствующие значения. Значение функции экспоненциального распределения (вероятности того, что нормально распределённое случайное значение не превысит указанную величину) вычисляется с помощью формулы

Определить величину, которую с заданной вероятностью не превысит экспоненциально распределённое случайное значение, можно с помощью формулы

где Вероятность — имя ячейки, содержащей требуемое значение вероятности.

Рис. 5. Графики экспоненциального распределения.

В программе MathCad те же вычисления могут быть выполнены с помощью формул

где Значение, Средняя и Вероятность — имена соответствующих переменных.

Распределение Пуассона

Распределение Пуассона (рис. 6) является дискретным распределением, моделирующим число независимых событий, происходящих в течение заданного промежутка времени, если вероятность наступления каждого из них в течение периода данной продолжительности одна и та же. Оно тесно связано с экспоненциальным распределением, моделирующим длительность промежутков времени между такими событиями.

Рис. 6. Полигоны распределения Пуассона.

Областью определения распределения Пуассона является множество целых неотрицательных чисел. Если случайная величина принимает дробные или отрицательные значения, её заведомо нельзя моделировать распределением Пуассона. Характерным признаком применимости распределения Пуассона в качестве модели случайной величины с заданным эмпирическим распределением является отсутствие существенного различия между эмпирическими значениями средней и дисперсии.

В соответствии с распределением Пуассона вероятность наступления k событий в течение периода составляет

где  — параметр распределения, одновременно равный математическому ожиданию величины k и её дисперсии. Вероятность наступления k событий или менее (включая отсутствие события) вычисляется по формуле

В Excel p ( k ) вычисляется с помощью формулы

а F ( k ) — с помощью функции

где в ячейках с именами ЧислоСобытий и Средняя хранятся значения k и  . Функции для вычисления k по заданной вероятности в Excel не предусмотрено. Эту величину не составляет труда найти подбором либо написав соответствующую функцию на VBA.

В MathCad аналогичные вычисления производятся с помощью формул

где ЧислоСобытий, Средняя и Вероятность — имена соответствующих переменных.

Логнормальное распределение

Логнормальное распределение (рис. 7) определено на интервале (0;). Если величина ln( x ) подчиняется нормальному распределению, то x — логнормальному. Логнормальное распределение является теоретической моделью случайной величины, представляющей собой произведение константы и стремящегося к бесконечности количества случайных величин (помех), распределённых по произвольным законам на интервале (0; ).

Плотность вероятности логнормального распределения задаётся формулой

где  — математическое ожидание величины ln( x ), а  — её среднеквадратическое отклонение. Математическое ожидание самой величины x в составляет а дисперсия —

Рис. 7. Графики логнормального распределения при  = 0.

Функция логнормального распределения через элементарные функции не выражается. Она записывается следующим образом:

Для вычисления функции плотности вероятности логнормального распределения в Excel при условии, что требуемое значение x хранится в ячейке под именем Значение, используйте формулу

где Средняя и СтандОткл — имена ячеек, содержащих значения  и  . Значение функции логнормального распределения (вероятности того, что нормально распределённое случайное значение не превысит указанную величину) вычисляется с помощью формулы

Определить величину, которую с заданной вероятностью не превысит нормально распределённое случайное значение, можно с помощью формулы

где Вероятность — имя ячейки, содержащей требуемое значение вероятности.

В MathCad для аналогичных целей используйте формулы dlnorm(x;  ;  ), plnorm(x;  ;  ) и qlnorm(p;  ;  ) соответственно, где используемые имена переменных имеют те же значения, что и в формуле плотности распределения.

Гамма-распределение

Гамма-распределение (рис. 8) описывает многие случайные величины, распределённые на интервале [0; ). Оно представляет собой теоретическую модель суммы  независимых случайных величин, распределённых по экспоненциальному закону с одинаковым параметром, равным  . Функция плотности гамма-распределения:

гамма-функция, значение которой для целых чисел равно факториалу её аргумента, уменьшенного на единицу; e  2,7182818 — основание натурального логарифма;  и  — параметры, которые можно определить, зная математическое ожидание  и дисперсию  2 , по следующим формулам:

Рис. 8. Графики гамма-распределения.

Частными случаями гамма-распределения являются экспоненциальное распределение (при  = 1), распределение Эрланга (при натураль­ном  ) и распределение  2 для n степеней свободы (при  = n /2 и  = 2).

С помощью гамма-распределения можно (при наличии теоретических оснований) моделировать левоскошенные эмпирические распределения на интервалах [ c ; ) и правоскошенные на интервалах (–; c ], где c — произвольное действительное число. Для этого в формуле плотности распределения в первом случае x прибавляют к c , во втором — отнимают от c .

В Excel плотность распределения вероятности гамма-распределения для значения, хранящегося в ячейке Значение, вычисляется с помощью формулы

где Средняя и Дисперсия — имена ячеек, содержащих соответствующие значения. Значение функции гамма-распределения (вероятности того, что случайное значение, распределённое по данному закону, не превысит указанную величину) вычисляется с помощью формулы

Определить величину, которую с заданной вероятностью не превысит случайное значение, подчиняющееся гамма-распределению, можно с помощью формулы

где Вероятность — имя ячейки, содержащей требуемое значение вероятности.

В программе MathCad те же вычисления могут быть выполнены с помощью формул

где имена переменных соответствуют обозначениям в формуле плотности гамма-распределения.

Бета-распределение

Бета-распределение (рис. 9) определено на интервале [0; 1]. Оно является теоретической моделью случайной величины A /( A + B ), зависящей от двух других случайных величин A и B , каждая из которых подчиняется гамма-распределению. Часто бета-распределение является подходящей моделью для величины, представляющей собой долю (или процент) от целого — например, доли пашни в сельхозугодьях или степени использования производственного потенциала.

Рис. 9. Графики бета-распределения.

Плотность бета-распределения задаётся функцией

где  и  — параметры, которые можно определить, зная математическое ожидание  и дисперсию  2 , по следующим формулам:

Равномерное распределение является частным случаем бета-распределения при  =1 и  =1.

Бета-распределение может быть использовано (при наличии теоретических оснований) для моделирования случайных величин, распределённых на произвольном отрезке [ a ; b ], где a и b имеют содержательную интерпретацию 1 . Для этого нужно перенормировать исходную случайную величину y , распределённую на [ a ; b ], по следующему правилу:

В Excel для вычисления плотности бета-распределения потребуется писать функцию на VBA. Функция бета-распределения может быть вычислена с помощью формулы

где в ячейке под именем Значение хранится значение случайной величины y , в ячейке Альфа — параметр  , в ячейке Бета — параметр  , в ячейке Начало — значение a , в ячейке Конец — значение b . Перенормирование величины y производится автоматически.

Определить значение y по заданной веротяности того, что оно не будет превышено (предположим, оно записано в ячейку под именем Вероятность), можно с помощью формулы

Встроенные функции MathCad не предусматривают перенормирование случайной величины — оно должно быть выполнено заранее. Плотность бета-распределения вычисляется с помощью формулы

где обозначения соответствуют использованным в формуле плотности распределения. Вероятность непревышения заданной величины определяется по формуле

а обратное вычисление —

где переменная p содержит пороговую вероятность. Поскольку результат представляет собой перенормированное значение, получить исходное значение y можно при помощи следующей формулы:

полагая, что границы a и b хранятся в одноимённых переменных программы MathCad.

2. Проверка согласованности эмпирического и теоретического распределений с помощью критерия  2

Как правило, критерий  2 имеет практическое значение для совокупностей численностью не менее 40 наблюдений. Для применения данного критерия интервал вариации случайной величины разбивается на непересекающиеся классы. О согласии теоретического и эмпирического распределений судят по наблюдаемым различиям в частоте попадания наблюдений в каждый класс по сравнению с частотой, которая должна бы была иметь место, если бы распределение в точности соответствовало теоретическому. Если различия настолько велики, что с достаточно высокой вероятностью 1 (обычно в экономических исследованиях требуют, чтобы она была не менее 95%, при остром недостатке данных — не менее 90% 2 ) не могли бы возникнуть, если бы распределение случайной величины соответствовало предполагаемому закону, — гипотезу о согласии эмпирического распределения с выбранным теоретическим отвергают.

В противном случае считают, что расхождение с предлагаемой теоретической моделью не доказано с достаточной степенью надёжности; а значит, нет оснований ставить под сомнение те теоретические соображения, на основе которых выдвинута гипотеза о законе распределения — по крайней мере, до тех пор, пока новые, более полные, данные не придут в противоречие с нею.

Выдвигая гипотезу о распределении, принимают во внимание следующие сведения (в меру их доступности):

область определения случайной величины;

происхождение данной случайной величины;

моменты распределения и их соотношение;

результаты моделирования данной случайной величины, полученные другими исследователями;

аналогии с другими случайными величинами, распределение которых установлено;

В качестве области определения случайной величины не следует принимать наблюдаемый диапазон вариации (иначе у нас никогда не оказалось бы оснований для использования нормального распределения). Её определяют исходя из сущности процесса или явления, отражаемого случайной величиной. Например, урожайность культуры не может быть ниже нуля; существует также её объективный верхний предел, зависящий от массы гумуса в почве. Поэтому для её моделирования может подойти какое-либо распределение, определённое на интервале [0; b ] — например, бета или (при недостатке данных) треугольное. При этом величину b , раз она неизвестна, можно определить подбором, добиваясь наилучшего согласия опытных данных с теоретическим распределением.

Можно ли использовать для моделирования урожайности, например, гамма-распределение? Очевидно, что в действительности урожайность не может соответствовать этому распределению, так как она в принципе не может быть сколь угодно большой. Но с некоторой степенью грубости гамма-распределение может оказаться практически приемлемой моделью, если оценённая по гамма-распределению (то есть теоретическая) вероятность значений урожайности, превышающих фактически наблюдаемые, пренебрежимо мала. То же касается нормального распределения, но тогда пренебрежимо мала должна быть также теоретическая вероятность отрицательных значений урожайности. Последнее часто не выполняется.

Если, кроме наблюдений, нет никаких оснований для выбора распределения, то следует отдавать предпочтение самым простым распределениям с наименьшим числом параметров. Если к тому же наблюдения малочисленны, лучше пользоваться такими распределениями, как равномерное и треугольное. Результаты, полученные при подобных обстоятельствах, требуют перепроверки в дальнейшем.

Параметры гипотетических распределений, если только они не известны заранее из теоретических соображений, определяют, когда возможно, на основе моментов эмпирического распределения (средней и дисперсии) 1 , а когда невозможно — подбором.

После того, как гипотеза сформулирована, можно приступать к её проверке. Процедура проверки по критерию  2 предполагает следующие этапы:

разбиение интервала вариации на непересекающиеся классы;

определение численности наблюдений эмпирического распределения, приходящихся на каждый класс;

определение теоретической численности наблюдений в соответствии с выбранной моделью случайной величины;

расчёт значения критерия  2 ;

определение критического уровня  2 для заданной доверительной вероятности;

сравнение фактического и критического значений  2 и заключение о том, следует ли отвергнуть предложенную теоретическую модель распределения случайной величины.

Рассмотрим каждый из этих этапов.

Считается, что практически приемлемый компромисс между численностью классов и численностью наблюдений в каждом классе достигается, если число классов определять по формуле где N — число наблюдений, а ширину классов принимают равной. Чтобы обеспечить приемлемую вероятность ошибки при расчёте значения  2 , необходимо следить за тем, чтобы как фактическая, так и теоретическая численность наблюдений в каждом классе была не меньше 6…8. Если это не выполняется, малочисленные классы объединяют; при этом численность классов не должна оказаться меньше пяти. В случае невыполнимости этих требований критерию  2 доверять нельзя 1 . Если данная процедура порождает очень много пустых классов, а случайная величина строго положительна, то целесообразно перейти к исследованию распределения её логарифмов.

Численность наблюдений, относящихся к каждому классу, обычно определяется по ранжированному ряду наблюдаемых данных с помощью функции Excel =СЧЁТЕСЛИ(Ряд,Условие).

Теоретическая численность наблюдений для каждого класса определяется как ( F ( x 2 ) – F ( x 1 ))· N , где F (·) — функция выбранного теоретического распределенияˆ, N — число имеющихся наблюдений, x 2 и x 1 — соответственно верхняя и нижняя границы класса.

Значение критерия  2 рассчитывается по формуле

где k — число классов, n i — число фактических наблюдений в классе i , n’ i — теоретическая численность наблюдений в классе i . При различных разбиениях на классы значение  2 оказывается различным, но при выполнении требований к числу наблюдений всего и в каждом классе, сформулированных выше, вероятность статистически существенных различий невелика.

Критическое значение может быть определено с помощью формулы Excel

где в ячейке УровеньДоверия содержится требуемая доверительная вероятность (выраженная в долях, а не в процентах), а в ячейке СтепениСвободы — величина, равная числу классов за вычетом увеличенного на единицу числа параметров теоретического распределения, определённых с использованием эмпирических данных. В MathCad аналогичный расчёт выполняется с помощью формулы

Если значение  2 превышает критическое, гипотезу о согласии распределений отвергают с выбранным уровнем доверия. В противном случае гипотеза не отвергается (что, разумеется, не означает её безусловной истинности: быть может, этот результат случаен, а может, действительное распределение мало отличается от гипотетического).

Расчёты по проверке согласованности теоретического и эмпирического распределений рекомендуется выполнять в таблице, строки которой (кроме итоговой) соответствуют классам, а столбцы — этапам вычислений. В частности, в ней должны быть представлены величины n i , n’ i и ( n i – n’ i ) 2 / n’ i .

3. Проверка статистических гипотез относительно многовершинных распределений

Многовершинность эмпирического распределения обычно свидетельствует о смешении совокупностей с разными качественными характеристиками. Строгий подход к исследованию таких совокупностей состоит в отыскании критерия, по которому наблюдения можно отнести к каждой из качественно различных совокупностей, которые затем исследуются отдельно. В частности, для каждой из них формулируется и проверяется отдельная гипотеза о распределении вероятностей значений исследуемых переменных.

Распределения наблюдений по качественно различающимся совокупностям необходимо выполнять всегда, когда имеется возможность для этого.

На этапе системного анализа часто отсутствуют данные, необходимые для выполнения такой процедуры. Возможны две ситуации: либо отсутствуют данные о показателях, необходимых для построения критерия отнесения наблюдения к различным совокупностям, либо наблюдений слишком мало, так что после классификации они вообще не будут поддаваться анализу.

В подобных случаях совокупность разбивают в точках минимума между вершинами, после чего для получившихся совокупностей выдвигают гипотезы о распределениях, не подвергая их проверке. В результате получают функции распределения F 1 ( x ), F 2 ( x ) и т.д.

Далее формулируют функцию вида

где N — число наблюденийˆ всего, N i — число наблюдений в совокупности i , n — число совокупностей (на одну меньше числа вершин).

Затем выдвигается гипотеза, что исследуемая случайная величина имеет данную функцию распределения. Затем она проверяется в обычном порядке по критерию  2 , только для определения теоретических частот вместо обычной F ( x ), соответствующей одному из известных распределений, используется данная функция, а при расчёте числа степеней свободы учитывается общее количество параметров, определённых на основе эмпирического распределения для всех F i ( x ).

4. Проверка независимости факторов с помощью критерия  2

Критерий  2 очень удобен для проверки независимости двух дискретных переменных. Если имеется набор наблюдений, в каждом из которых зафиксировано значение двух дискретных переменных, такой, что каждой паре значений дискретных переменных теоретическая частота, составляющая не менее 6-8 наблюдений, то с помощью данного критерия можно, не привлекая никаких других теоретических соображений, сделать заключение о том, проявляется ли какая-либо зависимость между этими переменными в имеющихся результатах наблюдений.

При достаточной численности наблюдений данный критерий наилучшим образом соответствует целям практического задания к теме 3 при проверке независимости переменных. Если гипотеза о независимости двух факторов отвергается, один из них должен быть исключён из модели и заменён другим. Если гипотеза о независимости результата от фактора не отвергается, фактор также следует исключить из модели, заменив его другим.

Процедура проверки предполагает следующие этапы:

подсчёт числа наблюдений, для каждого сочетания значений двух переменных;

подсчёт теоретической частоты n’ ij для каждого сочетания значений двух переменных, составляющей n 1 i · n 2 j / N , где n 1 i — число наблюдений i го значения первой переменной, n 2 j — число наблюдений j го значения второй переменной;

расчёт значения критерия  2 по формуле

где k 1 — число значений первой переменной; k 2 — число значений второй переменной; n ij — фактическое число наблюдений, при которых первая переменная принимала значение i , а вторая — значение j ; остальные обозначения прежние;

определение критического уровня  2 для заданной доверительной вероятности и числа степеней свободы ( k 1 –1)·( k 2 –1) — например, с помощью формулы Excel

где в ячейке УровеньДоверия содержится требуемая доверительная вероятность (выраженная в долях, а не в процентах), в ячейках _k1 и _k2 — число значений соответствующих дискретных переменных. В MathCad аналогичный расчёт выполняется с помощью формулы

сравнение фактического и критического значений  2 и заключение о том, следует ли отвергнуть предложенную теоретическую модель распределения случайной величины.

Если значение  2 превышает критическое, гипотезу о независимости факторов отвергают с выбранным уровнем доверия. В противном случае гипотеза не отвергается (что, разумеется, не означает её безусловной истинности: быть может, этот результат случаен).

Расчёты по проверке независимости факторов рекомендуется выполнять в таблице, строки которой (кроме итоговой) соответствуют комбинациям значений двух исследуемых переменных, а столбцы — этапам вычислений. В частности, в ней должны быть представлены величины n ij , n’ ij и ( n ij – n’ ij ) 2 / n’ ij .

5. Проверка существенности связи между переменными с помощью однофакторного дисперсионного анализа

Однофакторный дисперсионный анализ проверяет гипотезу о равенстве дисперсий некоторой нормально распределённой переменной в нескольких выборках. Отклонение этой гипотезы указывает, что различие между выборками заведомо не случайно, и тем самым выявляет существование зависимости между признаком, по которому осуществлялись выборки, и данной переменной.

Таким образом, он может быть использован для проверки наличия существенной связи между двумя переменными, из которых по крайней мере одна дискретна, а другая подчиняется нормальному закону распределения. Практически приемлемые результаты достигаются также для случая гамма-распределения: доверять им можно тем в большей степени, чем меньше его асимметрия.

Для выполнения однофакторного дисперсионного анализа в Excel следует расположить значения нормально распределённой переменной (она может быть как непрерывной, так и дискретной, но, разумеется, числовой; следовательно, процедуру можно проводить как до, так и после дискретизации переменной, выступающей в качестве зависимой), соответствующие разным значениям дискретного влияющего фактора (он может быть как числовым, так и нечисловым), в соседних столбцах. Число значений переменной в разных столбцах может быть различным. Над каждым столбцом указывают соответствующее значение влияющего фактора.

Далее следует подключить надстройку «Анализ данных» (если она не подключена) и дать команду Сервис  Анализ данных либо Данные  Анализ данных , смотря по версии программы. В качестве входного нужно указать интервал, охватывающий все ячейки со значениями нормально распределённой переменной и притом не содержащий никаких других текстовых или числовых данных, кроме меток влияющего фактора в его первой строке. Переключатели Группирование: по столбцам и Метки в первой строке должны быть включены. Выходной интервал указывается таким образом, чтобы выводимые в него данные не перезаписали уже имеющиеся (рекомендуется выводить результаты на новый лист).

Если по результатам анализа p -значение (уровень значимости) оказалось ниже величины 1 , дополняющей желаемый уровень доверия до единицы (например, меньше 0,05), то гипотеза о равенстве дисперсий переменной при разных значениях влияющего фактора отвергается, что означает наличие связи между ним и нормально распределённой зависимой переменной.

Применяя дисперсионный анализ в целях практикума, следует иметь в виду, что в качестве влияющей переменной всегда выбирается входная, а в качестве зависимой (нормально распределённой) может быть использована как входная, так и выходная переменная. Основаниями для исключения входной переменной из модели могут быть:

невозможность отвергнуть гипотезу о равенстве дисперсий выходной переменной при разных значениях данной входной переменной 2 ;

отвергнутая гипотеза о равенстве дисперсий одной входной переменной при разных значениях другой.

В процедурах системного анализа, выполняемого по данной методике, нет необходимости использовать многофакторный дисперсионный анализ, более требовательный к числу наблюдений, так как формализм условных вероятностей требует независимости входных переменных. При данных обстоятельствах процедура однофакторного дисперсионного анализа даёт достаточные основания для принятия решения о наборе переменных, включаемых в модель.

6. Процедура расчёта энтропии, снимаемой с переменной информацией о значении другой переменной

Полная энтропия зависимой дискретной переменной на основе имеющихся эмпирических данных рассчитывается следующим образом:

если исходные данные по переменной дискретны — по формуле

где p i = ( n i +1)/( N + k ) — оценка вероятности i -го дискретного значения зависимой переменной; k — число дискретных значений зависимой переменной; n i — число наблюдений i -го дискретного значения зависимой переменной; N — общее число наблюдений;

если проводилась дискретизация переменной путём разбиения на квантили — по формуле log 2 k , где k — число квантилей.

Остаточная энтропия зависимой дискретной переменной при поступлении информации о j м состоянии влияющей дискретной переменной вычисляется по формуле

где p ij = ( n ij +1)/( N j + k ) — оценка вероятности i -го дискретного значения зависимой переменной при j м значении влияющей переменной; k — число дискретных значений зависимой переменной; n ij — число наблюдений i -го дискретного значения зависимой переменной при j м значении влияющей переменной; N j — число наблюдений j го значения влияющей переменной.

Средняя информативность влияющей переменной относительно данной зависимой переменной составляет

где p j — оценка вероятности j го дискретного значения влияющей переменной, получаемая аналогично оценке для зависимой переменной.

Решение об исключени входной переменной из модели принимают в следующих случаях:

если в качестве зависимой переменной принимается выходная — если величина I / H меньше величины  / Q , где Q — число входных переменных, а параметр надёжности  , не превышающий 1, выбирается субъективно 1 . Чем больше его значение, тем труднее выполнить требования к переменной, включаемой в модель;

если в качестве зависимой переменной принимается входная — если величина I / H больше  .

7. Некоторые полезные статистические функции табличного процессора Microsoft Excel

Вычисляет дисперсию выборочных данных, содержащихся в интервале Ряд.

Вычисляет дисперсию генеральной совокупности данных, содержащейся в интервале Ряд.

Вычисляет одностороннюю предельную ошибку среднего для нормально распределённой совокупности данных для уровня доверия, равного (1–Значимость), при заданных среднеквадратичном отклонении СтандОткл и численности наблюдений ЧислоНаблюдений.

Вычисляет коэффициент парной линейной корреляции по Пирсону для двух совокупностей данных, содержащихся в интервалах Ряд1 и Ряд2. Число ячеек в обоих рядах должно быть одинаковым. Все они должны содержать числовые данные (пустые ячейки не допускаются).

Находит наибольшее значение среди данных, содержащихся в интервале Ряд.

Находит медиану совокупности данных, содержащихся в интервале Ряд.

Находит наименьшее значение среди данных, содержащихся в интервале Ряд.

Находит модальное значение совокупности данных, содержащихся в интервале Ряд, если таковое существует.

Находит среди данных в интервале Ряд значение, имеющее порядковый номер Ранг, если значения пронумеровать в порядке убывания.

Находит среди данных в интервале Ряд значение, имеющее порядковый номер Ранг, если значения пронумеровать в порядке возрастания.

Находит значение, которое вместе с другими не превышающими его значениями образует требуемую Персентиль (указываемую в долях) совокупности данных в интервале Ряд.

Определяет ранг значения Число в совокупности данных, содержащейся в интервале Ряд, по возрастанию (если значение Порядок равно нулю либо опущено) или по убыванию (если значение Порядок указано и не равно нулю). Значение Число обязательно должно присутствовать в интервале Ряд.

Вычисляет коэффициент асимметрии для эмпирического распределения, представленного данными в интервале Ряд.

Вычисляет среднее арифметическое по данным интервала Ряд.

Вычисляет среднее арифметическое для данных интервала Ряд, отвечающих критерию Условие. Критерий представляет собой текст вида ">2", "<-3,14159", где число может быть произвольным, либо ссылку на ячейку, содержащую формулу, результатом вычисления которой является подобное текстовое значение.

Вычисляет среднее арифметическое для данных интервала Ряд, отвечающих одновременно всем критериям, хранящимся в интервале Условия. Каждый критерий представляет собой текст вида ">2", "<-3,14159", где число может быть произвольным. Поддерживается не всеми версиями Excel.

Вычисляет среднеквадратическое отклонение выборочных данных, содержащихся в интервале Ряд.

Вычисляет среднеквадратическое отклонение данных генеральной совокупности, содержащейся в интервале Ряд.

Определяет число значений в интервале Ряд.

Определяет число значений в интервале Ряд, отвечающих критерию Условие. Критерий представляет собой текст вида ">2", "<-3,14159", где число может быть произвольным, либо ссылку на ячейку, содержащую формулу, результатом вычисления которой является подобное текстовое значение.

Определяет число значений в интервале Ряд, отвечающих одновременно всем критериям, хранящимся в интервале Условия. Каждый критерий представляет собой текст вида ">2", "<-3,14159", где число может быть произвольным. Поддерживается не всеми версиями Excel.

Вычисляет массив значений, каждое из которых означает число наблюдений из интервала РядДанных, относящихся к классу, задаваемому данными в интервале Границы.

Для использования функции следует выделить на одну ячейку больше, чем содержится их в интервале Границы, набрать содержащую её формулу и нажать сочетание клавиш [Ctrl]+[Shift]+[Enter]. В первой ячейке выделенного интервала отобразится число значений, которые не больше первого значения в интервале Границы; во второй — число значений между первым и вторым значениями в интервале Границы (исключая нижнюю границу и включая верхнюю) и т.д.; в последнем — значения, превышающие наибольшее значение в интервале Границы.

Значения в интервале Границы должны быть упорядочены по возрастанию. Пустые ячейки и текстовые значения игнорируются.

Вычисляет коэффициент эксцесса для эмпирического распределения, представленного данными в интервале Ряд.

8. Численное интегрирование

Необходимость вычисления определённых интегралов при решении задач системного анализа по методике, положенной в основу настоящего практикума, возникает, например, при определении ошибки оценки вероятности события по результатам наблюдений, при отыскании квантилей либо (в некоторых случаях) при проверке гипотезы о законе распределения случайной величины.

Для вычисления определённых интегралов в MathCad достаточно ввести требуемый интеграл в виде формулы. Чтобы ввести знак интеграла, следует нажать клавишу [&]. Например, вычисление формулы

даст тот же результат, что и формулы pnorm(10,5,2), а именно 0,99379.

Excel не имеет встроенных возможностей численного интегрирования. Если лабораторные работы выполняются в Excel, вычисление определённых интегралов можно осуществлять любым известным методом, например, методом трапеций или методом Симпсона. Описание соответствующих алгоритмов можно найти в сети Интернет либо в учебной литературе по численным методам 1 .

СОДЕРЖАНИЕ

методические указания преподавателю 6

Постановка задачи 10

Теоретическая часть 10

Варианты заданий для лабораторного практикума 15

Тема 1. Спецификация первого уровня аграрной производственной системы 17

Теоретическая часть 17

Практическая часть 22

Тема 2. Приведение числовых переменных к дискретной форме 25

Теоретическая часть 25

Практическая часть 27

Тема 3. Представление знаний о структуре системы в форме условных вероятностей. Проверка существенности и независимости переменных 30

Теоретическая часть 30

Практическая часть 35

Тема 4. Спецификация второго уровня аграрной производственной системы 39

Теоретическая часть 39

Практическая часть 41

Тема 5. Тестирование двухуровневой модели 44

Теоретическая часть 44

Практическая часть 47

1. Основные статистические распределения 51

2. Проверка согласованности эмпирического и теоретического распределений с помощью критерия 2 68

3. Проверка статистических гипотез относительно многовершинных распределений 72

4. Проверка независимости факторов с помощью критерия 2 73

5. Проверка существенности связи между переменными с помощью однофакторного дисперсионного анализа 75

6. Процедура расчёта энтропии, снимаемой с переменной информацией о значении другой переменной 77

7. Некоторые полезные статистические функции табличного процессора Microsoft Excel 79

8. Численное интегрирование 82

1 Например, следует учитывать, что трудоёмкость предварительного статистического анализа числовой переменной значительно выше, чем нечисловой. Преподавателю рекомендуется контролировать равномерность распределения учебной нагрузки между студентами в рабочих группах, а при необходимости своевременно предупреждать студентов как о чрезмерности намеченного объёма работ, так и о его недостаточности для отличной (хорошей, удовлетворительной) рейтинговой оценки.

1 Например, информация о них поступает лишь тогда, когда выходная переменная уже известна достоверно.

2 В статистико-математических и эконометрических приложениях следует различать понятия «оценка» (estimate – англ.) — суждение о величине параметра, не поддающегося непосредственному наблюдению, на основе и «оценивание» (estimation– англ.) — процесс получения оценки.

1 Фактор, требующий представления в векторной форме, должен рассматриваться как набор факторов, соответствующих каждому компоненту вектора.

2 Как правило, процедура измерения приводится в форме ссылки на источник, в котором она описана.

1 Всеми необходимыми возможностями для этого обладают табличные процессоры.

1 Предполагается, что одна страница содержит не более 40 строк по 66 символов.

1 В ряде случаев для таких переменных гипотеза о нормальном распределении может быть приемлемой, если вероятность отрицательных значений согласно теоретическому распределению исчезающе мала.

1 При гамма-распределении результаты оценки тесноты связи при посредстве дисперсионного анализа содержат ошибку, величина которой, однако, для большинства практических приложений не слишком велика.

2 Если наблюдений больше 30 — можно использовать нормальное распределение, которое является пределом распределения Стьюдента при бесконечном числе наблюдений.

1 За исключением тех редких случаев, когда оно оказывается частным случаем бета-распределения.

1 За исключением тех редких случаев, когда оно оказывается частным случаем бета-распределения.

1 Например, если коровы массой менее 400 и более 520 кг выбраковываются из основного стада, то при проверке гипотезы о согласии распределения живой массы коров с бета-распределением значения a =400, b =520 будут приняты обоснованно. Если же верхняя граница массы для выбраковки не установлена, достаточных оснований для моделирования эмпирического распределения живой массы с помощью бета-распределения нет.

1 Эту пороговую вероятность называют уровнем доверия , или доверительной вероятностью .

2 В последнем случае результаты обычно требуют перепроверки с привлечением новых наблюдений.

1 См. формулы для определения значений параметров распределений при известных средней и дисперсии в Приложении 1.

1 В учебных заданиях данного практикума разрешается смягчать эти требования в соответствии с указаниями преподавателя, обязательно отмечая в отчёте, что результат проверки гипотезы о согласии теоретического и эмпирического распределений недостоверен по причине недостаточной численности имеющихся наблюдений.

1 Алгоритм расчёта приведён, например, в издании: Красс М.С., Чупрынов Б.П. Математические методы и модели для магистрантов экономики: Учеб. пособие. СПБ.: Питер, 2006. — С. 171-172.

2 При большом числе входных переменных влияние каждой из них может быть весьма слабым. В этом случае при использовании однофакторного дисперсионного анализа в целях определения набора входных переменных, включаемых в модель, следует использовать уровни доверия, очень близкие к единице.

1 Для целей данного практикума можно принять его равным 0,3.

1 Численные методы / Н.С. Бахвалов, Н.П. Жидков, Г.М. Кобельков. 4 е изд. М.: БИНОМ. Лаборатория знаний, 2006.

Гистограммы с интервалами

Когда набор данных содержит так много разных значений, что мы не можем удобно связать их с отдельными столбцами гистограммы, мы используем объединение в интервалы (биннинг). То есть мы определяем диапазон значений как интервал, группируем результаты измерений в эти интервалы и создаем по одному столбцу для каждого интервала.

Следующая гистограмма, которая была сгенерирована из нормально распределенных данных со средним значением 0 и стандартным отклонением 0,6, использует интервалы вместо отдельных значений:

Рисунок 2 Гистограмма с использованием интервалов вместо отдельных значений Рисунок 2 – Гистограмма с использованием интервалов вместо отдельных значений

Горизонтальная ось разделена на десять интервалов одинаковой ширины, и каждому интервалу назначен один столбец. Все результаты измерений, попадающие в числовой интервал, влияют на высоту соответствующего столбца (метки на горизонтальной оси показывают, что интервалы не одинаковой ширины, но это просто потому, что значения меток округлены).

Вычисление функции Лапласа в Microsoft Excel

Функция Лапласа в Microsoft Excel

Одной из самых известных неэлементарных функций, которая применяется в математике, в теории дифференциальных уравнений, в статистике и в теории вероятностей является функция Лапласа. Решение задач с ней требует существенной подготовки. Давайте выясним, как можно с помощью инструментов Excel произвести вычисление данного показателя.

Процедура вычисления

Этот метод используется при интервальной оценке различных статистических величин. Главная задача данного расчета – избавится от неопределенностей точечной оценки.

В Экселе существуют два основных варианта произвести вычисления с помощью данного метода: когда дисперсия известна, и когда она неизвестна. В первом случае для вычислений применяется функция ДОВЕРИТ.НОРМ, а во втором — ДОВЕРИТ.СТЮДЕНТ.

Способ 1: функция ДОВЕРИТ.НОРМ

Оператор ДОВЕРИТ.НОРМ, относящийся к статистической группе функций, впервые появился в Excel 2010. В более ранних версиях этой программы используется его аналог ДОВЕРИТ. Задачей этого оператора является расчет доверительного интервала с нормальным распределением для средней генеральной совокупности.

Его синтаксис выглядит следующим образом:

«Альфа» — аргумент, указывающий на уровень значимости, который применяется для расчета доверительного уровня. Доверительный уровень равняется следующему выражению:

«Стандартное отклонение» — это аргумент, суть которого понятна из наименования. Это стандартное отклонение предлагаемой выборки.

«Размер» — аргумент, определяющий величину выборки.

Все аргументы данного оператора являются обязательными.

Функция ДОВЕРИТ имеет точно такие же аргументы и возможности, что и предыдущая. Её синтаксис таков:

Как видим, различия только в наименовании оператора. Указанная функция в целях совместимости оставлена в Excel 2010 и в более новых версиях в специальной категории «Совместимость». В версиях же Excel 2007 и ранее она присутствует в основной группе статистических операторов.

Граница доверительного интервала определяется при помощи формулы следующего вида:

Где X – это среднее выборочное значение, которое расположено посередине выбранного диапазона.

Теперь давайте рассмотрим, как рассчитать доверительный интервал на конкретном примере. Было проведено 12 испытаний, вследствие которых были получены различные результаты, занесенные в таблицу. Это и есть наша совокупность. Стандартное отклонение равно 8. Нам нужно рассчитать доверительный интервал при уровне доверия 97%.

    Выделяем ячейку, куда будет выводиться результат обработки данных. Щелкаем по кнопке «Вставить функцию».

Переход в Мастер функций в Microsoft Excel

Переход в окно аргументов функции ДОВЕРИТ.НОРМ в Microsoft Excel

Значит, чтобы посчитать уровень значимости, то есть, определить значение «Альфа» следует применить формулу такого вида:

То есть, подставив значение, получаем:

Путем нехитрых расчетов узнаем, что аргумент «Альфа» равен 0,03. Вводим данное значение в поле.

Как известно, по условию стандартное отклонение равно 8. Поэтому в поле «Стандартное отклонение» просто записываем это число.

В поле «Размер» нужно ввести количество элементов проведенных испытаний. Как мы помним, их 12. Но чтобы автоматизировать формулу и не редактировать её каждый раз при проведении нового испытания, давайте зададим данное значение не обычным числом, а при помощи оператора СЧЁТ. Итак, устанавливаем курсор в поле «Размер», а затем кликаем по треугольнику, который размещен слева от строки формул.

Окно аргументов функции ДОВЕРИТ.НОРМ в Microsoft Excel

Переход в окно аргументов функции СЧЁТ в Microsoft Excel

Группа аргументов «Значения» представляет собой ссылку на диапазон, в котором нужно рассчитать количество заполненных числовыми данными ячеек. Всего может насчитываться до 255 подобных аргументов, но в нашем случае понадобится лишь один.

Окно аргументов функции СЧЁТ в Microsoft Excel

Результат вычисления функции ДОВЕРИТ.НОРМ в Microsoft Excel

Данный оператор предназначен для расчета среднего арифметического значения выбранного диапазона чисел. Он имеет следующий довольно простой синтаксис:

Аргумент «Число» может быть как отдельным числовым значением, так и ссылкой на ячейки или даже целые диапазоны, которые их содержат.

Переход в Мастер функций в программе Microsoft Excel

Переход в окно аргументов функции СРЗНАЧ в Microsoft Excel

Окно аргументов функции СРЗНАЧ в Microsoft Excel

Результат расчета функции СРЗНАЧ в Microsoft Excel

Правая граница доверительного интервала в Microsoft Excel

Левая граница доверительного интервала в Microsoft Excel

Правая граница доверительного интервала одной формулой в Microsoft Excel

Левая граница доверительного интервала одной формулой в Microsoft Excel

Способ 2: функция ДОВЕРИТ.СТЮДЕНТ

Кроме того, в Экселе есть ещё одна функция, которая связана с вычислением доверительного интервала – ДОВЕРИТ.СТЮДЕНТ. Она появилась, только начиная с Excel 2010. Данный оператор выполняет вычисление доверительного интервала генеральной совокупности с использованием распределения Стьюдента. Его очень удобно использовать в том случае, когда дисперсия и, соответственно, стандартное отклонение неизвестны. Синтаксис оператора такой:

Как видим, наименования операторов и в этом случае остались неизменными.

Посмотрим, как рассчитать границы доверительного интервала с неизвестным стандартным отклонением на примере всё той же совокупности, что мы рассматривали в предыдущем способе. Уровень доверия, как и в прошлый раз, возьмем 97%.

    Выделяем ячейку, в которую будет производиться расчет. Клацаем по кнопке «Вставить функцию».

Вставить функцию в Microsoft Excel

Переход в окно аргументов функции ДОВЕРИТ.СТЮДЕНТ в Microsoft Excel

В поле «Альфа», учитывая, что уровень доверия составляет 97%, записываем число 0,03. Второй раз на принципах расчета данного параметра останавливаться не будем.

Переход к другим функциям в Microsoft Excel

Переход в окно аргументов функции СТАНДОТКЛОН.В в Microsoft Excel

Нетрудно догадаться, что аргумент «Число» — это адрес элемента выборки. Если выборка размещена единым массивом, то можно, использовав только один аргумент, дать ссылку на данный диапазон.

Окно аргументов функции СТАНДОТКЛОН.В в Microsoft Excel

Окно аргументов функции ДОВЕРИТ.СТЮДЕНТ в Microsoft Excel

Окно аргументов функции СЧЁТ в программе Microsoft Excel

Результат вычисления функции ДОВЕРИТ.СТЬЮДЕНТ в Microsoft Excel

Результат расчета функции СРЗНАЧ в программе Microsoft Excel

Правая граница доверительного интервала в программе Microsoft Excel

Левая граница доверительного интервала в программе Microsoft Excel

Правая граница доверительного интервала одной формулой в программе Microsoft Excel

Левая граница доверительного интервала одной формулой в программе Microsoft Excel

Как видим, инструменты программы Excel позволяют существенно облегчить вычисление доверительного интервала и его границ. Для этих целей используются отдельные операторы для выборок, у которых дисперсия известна и неизвестна.

ЗакрытьМы рады, что смогли помочь Вам в решении проблемы.

Помимо этой статьи, на сайте еще 12049 инструкций.
Добавьте сайт Lumpics.ru в закладки (CTRL+D) и мы точно еще пригодимся вам.

Отблагодарите автора, поделитесь статьей в социальных сетях.

ЗакрытьОпишите, что у вас не получилось. Наши специалисты постараются ответить максимально быстро.

Решение задач на вычисление вероятности в Excel

Пример 4.В партии 20 изделий, из них 5 бракованных. Найти вероятность того, что в выборке из 4 изделий ровно одно бракованное.

Решение. В данной задаче, прежде всего, определим значения параметров: число_успехов_ в_ выборке = 1; размер_ выборки = 4; число_ успехов_ в_ совокупности = 5; размер_ совокупности = 20.

Искомую вероятность можно рассчитать с помощью функции =ГИПЕРГЕОМЕТ(1; 4; 5; 20), которая дает значение 0,4696.

Если производится несколько испытаний, причем ве­роятность события А в каждом испытании не зависит от исходов других испытаний, то такие испытания называют независимыми относительно событияА.

Пусть производится n независимых испытаний, в каждом из которых событие А может появиться либо не появиться. Вероятность события А в каждом испытании одна и та же, а именно равна р. Следовательно, вероятность ненаступления события А в каждом испытании также постоянна и равна q = 1 – р.

Вероятность того, что при n повторных независимых испытаниях событие А осуществится ровно k раз вычисляется по формуле Бернулли: .

Для нахождения наиболее вероятного числа успехов k по заданным n и р можно воспользоваться неравенствами np – q £ k £ np + p или правилом: если число np + p не целое, то k равно целой части этого числа.

В случае, если n велико, р мало, а , используют асимптотическую формулу Пуассона вычисления вероятности наступления события А ровно k раз при n повторных независимых испытаниях: .

Пример 5. Вероятность того, что расход электроэнергии на протяжении одних суток не превысит установленной нормы, равна р = 0,75. Найти вероятность того, что в ближайшие 6 суток расход электроэнергии в течение 4 суток не превысит нормы.

Решение. Вероятность нормального расхода элек­троэнергии на протяжении каждых из 6 суток постоянна и равна p = 0,75. Следовательно, вероятность перерасхода электроэнергии в каждые сутки также постоянна и равна q = 1— р = 1 — 0,75 = 0,25. Искомая вероятность по формуле Бернулли равна = 0,297. Для вычисления в Excel используем формулу =БИНОМРАСП(4; 6; 0,75; 0), которая дает значение 0,297. При этом определены следующие значения параметров: число_ успехов = 4; число_ испытаний = 6; вероятность_ успеха = 0,75; интегральная = 0. Подробно с синтаксисом функции БИНОМРАСП можно ознакомиться с помощью справки.

Пример 6. Телефонная станция обслуживает 400 абонентов. Для каждого абонента вероятность того, что в течение часа он позвонит на станцию, равна 0,01. Найти вероятность, что в течение часа ровно 5 абонентов позвонят на станцию.

Решение.Так как р = 0,01 мало и n = 400 велико, то будем пользоваться приближенной формулой Пуассона при l = 400 × 0,01 = 4. Тогда Р400(5) » » 0,156293. Для вычисления в Excel используем формулу =ПУАССОН(5; 4; 0), которая дает значение 0,156293. При этом определены следующие значения параметров: количество_ событий = 5; среднее(λ) = 4; интегральная = 0. Подробно с синтаксисом функции ПУАССОН можно ознакомиться в справке.

В случае, когда число повторных испытаний большое и формула Бернулли неприменима, используют формулы Лапласа.

Локальная теорема Лапласа. Если вероятность р появления события А в каждом испытании постоянна и отлична от нуля и единицы, то вероятность того, что событие А появится в n испытаниях ровно k раз, приближенно равна (тем точнее, чем больше n) значению функции , где .

Имеются таблицы, в которых помещены значения функции .

Интегральная теорема Лапласа. Если вероятность р наступления события А в каждом испытании постоянна и отлична от нуля и еди­ницы, то вероятность того, что событие А появится в n испытаниях от k1 до k2 раз, приближенно равна определенному интегралу:

При решении задач, требующих применения интеграль­ной теоремы Лапласа, пользуются специальными таблицами для интеграла , тогда .

Пример 7. Найти вероятность того, что событие А на­ступит ровно 80 раз в 400 испытаниях, если вероятность появления этого события в каждом испытании равна 0,2.

Решение. По условию n = 400; k = 80; р = 0,2; q = 0,8. Воспользуемся асимптотической формулой Лап­ласа: , , . Для вычисления в Excel используем формулу =НОРМРАСП(80; 80; 8; 0), которая дает значение 0,04986. При этом определены следующие значения параметров: k = 80; среднее= np = 80; стандартное_откл = = = 8, интегральная = 0. Подробно с синтаксисом функции НОРМРАСП можно ознакомиться с помощью справки.

Пример 8. Вероятность того, что деталь не прошла проверку ОТК, равна 0,2. Найти вероятность того, что среди 400 случайно отобранных деталей окажется непроверенных от 70 до 100 деталей.

Решение.Воспользуемся интегральной формулой Лапласа: n = 400; k1= 70; k2=100; р = 0,2; q = 0,8; . Так как функция является нечетной, то P400(70; 100) = Ф(2,5)+ + Ф(1,25) = 0,4938 + 0,3944 = 0,8882.

Для вычисления в Excel используем формулу нормального распределения =НОРМРАСП(100; 80; 8; 1) — НОРМРАСП(70; 80; 8; 1), которая дает значение 0,8882. При этом параметр интегральная = 1, остальные значения параметров определяются аналогично примеру, рассмотренному выше.

Ссылка на основную публикацию