Примеры функции КВАРТИЛЬ в Excel для расчета медианы квартиля

Расчет показателей вариации в ms excel

Число1, число2, . — это от 1 до 30 числовых аргументов, соответствующих выборке из генеральной совокупности.

  • ДИСП предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, вычисляйте дисперсию, используя функцию ДИСПР.
  • Логические значения, такие как ИСТИНА или ЛОЖЬ, а также текст игнорируются. Если они не должны игнорироваться, пользуйтесь функцией рабочего листа ДИСПА.
  • ДИСП использует следующую формулу:

Медиана и квартили

Квантили нормального распределения

Основная статья: Медиана (статистика)

  • 0,25-квантиль называется первым (или нижним) кварти́лем (от лат. quarta — четверть);
  • 0,5-квантиль называется медианой (от лат. mediāna — середина) или вторым кварти́лем;
  • 0,75-квантиль называется третьим (или верхним) кварти́лем.

Интеркварти́льным размахом (англ. Interquartile range) называется разность между третьим и первым квартилями, то есть x,75−x,25<\displaystyle x_<0<,>75>-x_<0<,>25>>. Интерквартильный размах является характеристикой разброса распределения величины и является робастным аналогом дисперсии. Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.

Входные параметры

X — Входные данные
вектор | массив

Входные данные в виде вектора или массива.

Типы данных: double | single

p — Интегральные вероятности
скаляр | вектор

Интегральные вероятности, для которых можно вычислить квантили в виде скаляра или вектора из скаляров от 0 до 1.

Пример: 0.3

Пример: [0.25, 0.5, 0.75]

Пример: (0:0.25:1)

Типы данных: double | single

N — Количество квантилей
положительное целое число

Количество квантилей, чтобы вычислить в виде положительного целого числа. quantile возвращает N квантили, которые делят набор данных на равномерно распределенный N +1 сегмент.

Типы данных: double | single

dim — Размерность
положительное целое число

Размерность, вдоль который квантили матричного X требуются в виде положительного целого числа. Например, для матричного X , когда dim = 1, quantile возвращает квантиль (квантили) столбцов X ; когда dim = 2, quantile возвращает квантиль (квантили) строк X . Для многомерного массива X , длина dim размерность th Y совпадает с длиной p .

Типы данных: single | double

vecdim — Вектор из размерностей
положительный целочисленный вектор

Вектор из размерностей в виде положительного целочисленного вектора. Каждый элемент vecdim представляет размерность входного массива X . В самой маленькой заданной операционной размерности (то есть, размерность min(vecdim) ), выход Y имеет длину, равную количеству квантилей, которые требуют (любой N или length(p) ). В каждой из остающихся операционных размерностей, Y имеет длину 1. Другие длины размерности являются тем же самым для X и Y .

Например, считайте 2 3х3 массивом X с p = [0.2 0.4 0.6 0.8] . В этом случае, quantile(X,p,[1 2]) возвращает массив, где каждая страница массива содержит 0.2, 0.4, 0.6, и 0,8 квантиля элементов на соответствующей странице X . Поскольку 1 и 2 операционные размерности, с min([1 2]) = 1 и length(p) = 4 , выход является 4 1 3 массивами.

Типы данных: single | double

method — Метод для вычисления квантилей
‘exact’ (значение по умолчанию) | ‘approximate’

Метод для вычисления квантилей в виде ‘exact’ или ‘approximate’ . По умолчанию, quantile возвращает точные квантили путем реализации алгоритма, который использует сортировку. Можно задать ‘method’,’approximate’ для quantile возвратить аппроксимированные квантили путем реализации алгоритма, который использует T-обзор.

Типы данных: char | string

Этот показатель представляет собой отношение стандартного отклонения к среднему арифметическому. Полученный результат выражается в процентах.

В Экселе не существует отдельно функции для вычисления этого показателя, но имеются формулы для расчета стандартного отклонения и среднего арифметического ряда чисел, а именно они используются для нахождения коэффициента вариации.

Шаг 1: расчет стандартного отклонения

Стандартное отклонение, или, как его называют по-другому, среднеквадратичное отклонение, представляет собой квадратный корень из дисперсии. Для расчета стандартного отклонения используется функция СТАНДОТКЛОН. Начиная с версии Excel 2010 она разделена, в зависимости от того, по генеральной совокупности происходит вычисление или по выборке, на два отдельных варианта: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В.

Синтаксис данных функций выглядит соответствующим образом:

= СТАНДОТКЛОН(Число1;Число2;…) = СТАНДОТКЛОН.Г(Число1;Число2;…) = СТАНДОТКЛОН.В(Число1;Число2;…)

    Для того, чтобы рассчитать стандартное отклонение, выделяем любую свободную ячейку на листе, которая удобна вам для того, чтобы выводить в неё результаты расчетов. Щелкаем по кнопке «Вставить функцию». Она имеет внешний вид пиктограммы и расположена слева от строки формул.

Переход в Мастер функций в Microsoft Excel

Переход к аргументам функции СТАНДОТКЛОН.В в Microsoft Excel

Аргументы функции СТАНДОТКЛОН.В в Microsoft Excel

Результат расчета функции СТАНДОТКЛОН.В в Microsoft Excel

Урок: Формула среднего квадратичного отклонения в Excel

Шаг 2: расчет среднего арифметического

Среднее арифметическое является отношением общей суммы всех значений числового ряда к их количеству. Для расчета этого показателя тоже существует отдельная функция — СРЗНАЧ. Вычислим её значение на конкретном примере.

    Выделяем на листе ячейку для вывода результата. Жмем на уже знакомую нам кнопку «Вставить функцию».

Перемещение в Мастер функций в Microsoft Excel

Переход к аргументам функции СРЗНАЧ в Microsoft Excel

Аргументы функции СРЗНАЧ в Microsoft Excel

Результат расчета функции СРЗНАЧ в Microsoft Excel

Урок: Как посчитать среднее значение в Excel

Шаг 3: нахождение коэффициента вариации

Теперь у нас имеются все необходимые данные для того, чтобы непосредственно рассчитать сам коэффициент вариации.

    Выделяем ячейку, в которую будет выводиться результат. Прежде всего, нужно учесть, что коэффициент вариации является процентным значением. В связи с этим следует поменять формат ячейки на соответствующий. Это можно сделать после её выделения, находясь во вкладке «Главная». Кликаем по полю формата на ленте в блоке инструментов «Число». Из раскрывшегося списка вариантов выбираем «Процентный». После этих действий формат у элемента будет соответствующий.

Форматированиае ячейки в Microsoft Excel

Вычисление коэффициента вариации в Microsoft Excel

Результат расчета коэффициента вариации в Microsoft Excel

Таким образом мы произвели вычисление коэффициента вариации, ссылаясь на ячейки, в которых уже были рассчитаны стандартное отклонение и среднее арифметическое. Но можно поступить и несколько по-иному, не рассчитывая отдельно данные значения.

    Выделяем предварительно отформатированную под процентный формат ячейку, в которой будет выведен результат. Прописываем в ней формулу по типу:

Вместо наименования «Диапазон значений» вставляем реальные координаты области, в которой размещен исследуемый числовой ряд. Это можно сделать простым выделением данного диапазона. Вместо оператора СТАНДОТКЛОН.В, если пользователь считает нужным, можно применять функцию СТАНДОТКЛОН.Г.

Расчет коэффициента вариации в Microsoft Excel

Результат расчета коэффициента вариации в программме Microsoft Excel

Существует условное разграничение. Считается, что если показатель коэффициента вариации менее 33%, то совокупность чисел однородная. В обратном случае её принято характеризовать, как неоднородную.

Как видим, программа Эксель позволяет значительно упростить расчет такого сложного статистического вычисления, как поиск коэффициента вариации. К сожалению, в приложении пока не существует функции, которая высчитывала бы этот показатель в одно действие, но при помощи операторов СТАНДОТКЛОН и СРЗНАЧ эта задача очень упрощается. Таким образом, в Excel её может выполнить даже человек, который не имеет высокого уровня знаний связанных со статистическими закономерностями.

Подготовка данных

Чтобы лучше понять материал и работать с одними и теми же цифрами, скачайте книгу Excel с примером Диаграмма ящик с усами.xlsx.

Данные, используемые в примере имеют нормальное распределение со средним значением равным 10 и стандартным отклонением равным 5-ти. Данные имеют четыре столбца по 20 значений.

Все значения положительные, так как при смешанном (положительные и отрицательные значения) виде, данная методика требует некоторых модификаций.

91-2-Данные для boxplot

Прежде чем начать строить диаграмму, нам необходимо произвести некоторые расчеты и подготовить данные. Для этого вставьте пустые строки над массивом и заполните заголовки показателями, которые потребуются для построения диаграммы, как показано на рисунке.

Читайте также:  Работа со сводными таблицами в Excel на примерах

91-3-подготовка данных для boxplot

Для начала рассчитаем некоторые простые статистические меры, такие как количество значений, среднее и стандартное отклонение. Формулы, используемые для расчетов отображены на рисунке ниже.

91-4-данные для boxblop

Теперь рассчитаем минимум, максимум, медиану, значение первого и третьего квартиля.

91-5-данные для boxblop

Наконец, давайте определим значения, которые станут основой построения. Наша диаграмма имеет коробку второго квартиля, которая отображает разницу между медианой и первым квартилем, значения которых мы рассчитали ранее. Также имеется коробка третьего квартиля – рассчитывается как разница между значением третьего квартиля и медианой. Нижняя часть коробки опирается на первый квартиль. Длина нижних усов равняется значению первого квартиля минус минимальное значение, длина верхних усов – максимум минус значение третьего квартиля.

91-6-данные для boxblop

Третий способ как рассчитать среднее значение в Excel.

Воспользуемся кнопкой вызова функции: Вставить функцию.

Среднее значение. Функция СРЗНАЧ в MS Excel. Описание и примеры

Выбираем ячейку, в которой должно появиться среднее значение, которое нам нужно рассчитать. Например, в ячейки Н3. После нажатия на кнопку Вставить функцию, появиться диалоговое окно Вставка функции, в котором будет перечень 10 недавно использовавшихся функций, в числе которых может быть интересующее нас функция: СРЗНАЧ. Если данной функции в перечне не будет, нужно воспользоваться поиском. В поле поиска нужно прописать СРЗНАЧ и нажать Найти.

Среднее значение. Функция СРЗНАЧ в MS Excel. Описание и примеры

Нажимаем ОК. Появляется диалоговое окно Аргументы функции.

Среднее значение. Функция СРЗНАЧ в MS Excel. Описание и примеры

В поле Число 1, нужно внести диапазон ячеек, по которым нужно рассчитать среднее значение. Становимся курсором на поле Число 1 и выделяем нужный нам диапазон ячеек.

Среднее значение. Функция СРЗНАЧ в MS Excel. Описание и примеры

Нажимаем ОК. Получаем среднее значение по заданному диапазону ячеек.

В поле Число 2, можно добавить еще один диапазон ячеек. И тогда функция будет считать среднее по двум диапазонам. Причем, если добавить диапазон в поле Число 2, то в диалоговом окне Аргументы функции появиться еще одно поле: Число 3. В которое так же можно добавить диапазон ячеек. Соответственно, если добавить диапазон в поле Число 3, появиться поле Число 4 и так далее.

Среднее значение. Функция СРЗНАЧ в MS Excel. Описание и примеры

В поля Число 1, Число 2, Число 3 и т.д., можно, в место диапазона ячеек, указывать отдельные ячейки и рассчитывать по ним среднее значение. Ячейки при этом могут находится в разных частях Листа.

Диапазоны ячеек или отдельные ячейки, для подсчета среднего значения, могут находиться на разных Листах книги. Само искомое среднее значение, так же может находиться на отдельном листе от исходных данных. Алгоритм работы с функцией СРЗНАЧ в током случае не будет отличаться от описанного выше.

Формула медианы

Формула медианы в статистике для дискретных данных чем-то напоминает формулу моды. А именно тем, что формулы как таковой нет. Медианное значение выбирают из имеющихся данных и только, если это невозможно, проводят несложный расчет.

Первым делом данные ранжируют (сортируют по убыванию). Далее есть два варианта. Если количество значений нечетно, то медиана будет соответствовать центральному значению ряда, номер которого можно определить по формуле:

Me – номер значения, соответствующего медиане,

N – количество значений в совокупности данных.

Тогда медиана обозначается, как

Это первый вариант, когда в данных есть одно центральное значение. Второй вариант наступает тогда, когда количество данных четно, то есть вместо одного есть два центральных значения. Выход прост: берется средняя арифметическая из двух центральных значений:

В интервальных данных выбрать конкретное значение не представляется возможным. Медиану рассчитывают по определенному правилу.

Для начала (после ранжирования данных) находят медианный интервал. Это такой интервал, через который проходит искомое медианное значение. Определяется с помощью накопленной доли ранжированных интервалов. Где накопленная доля впервые перевалила через 50% всех значений, там и медианный интервал.

Не знаю, кто придумал формулу медианы, но исходили явно из того предположения, что распределение данных внутри медианного интервала равномерное (т.е. 30% ширины интервала – это 30% значений, 80% ширины – 80% значений и т.д.). Отсюда, зная количество значений от начала медианного интервала до 50% всех значений совокупности (разница между половиной количества всех значений и накопленной частотой предмедианного интервала), можно найти, какую долю они занимают во всем медианном интервале. Вот эта доля аккурат переносится на ширину медианного интервала, указывая на конкретное значение, именуемое впоследствии медианой.

Обратимся к наглядной схеме.

Немного громоздко получилось, но теперь, надеюсь, все наглядно и понятно. Чтобы при расчете каждый раз не рисовать такой график, можно воспользоваться готовой формулой. Формула медианы имеет следующий вид:

где xMe — нижняя граница медианного интервала;

iMe — ширина медианного интервала;

∑f/2 — количество всех значений, деленное на 2 (два);

S(Me-1)— суммарное количество наблюдений, которое было накоплено до начала медианного интервала, т.е. накопленная частота предмедианного интервала;

fMe — число наблюдений в медианном интервале.

Как нетрудно заметить, формула медианы состоит из двух слагаемых: 1 – значение начала медианного интервала и 2 – та самая часть, которая пропорциональна недостающей накопленной доли до 50%.

Для примера рассчитаем медиану по следующим данным.

Требуется найти медианную цену, то есть ту цену, дешевле и дороже которой по половине количества товаров. Для начала произведем вспомогательные расчеты накопленной частоты, накопленной доли, общего количества товаров.

По последней колонке «Накопленная доля» определяем медианный интервал – 300-400 руб (накопленная доля впервые более 50%). Ширина интервала – 100 руб. Теперь остается подставить данные в приведенную выше формулу и рассчитать медиану.

То есть у одной половины товаров цена ниже, чем 350 руб., у другой половины – выше. Все просто. Средняя арифметическая, рассчитанная по этим же данным, равна 355 руб. Отличие не значительное, но оно есть.

Медиана (статистика)

Медиана (статистика) , в математической статистике — число, характеризующее выборку (например, набор чисел). Если все элементы выборки различны, то медиана — это такое число выборки, что ровно половина из элементов выборки больше него, а другая половина меньше него. В более общем случае медиану можно найти, упорядочив элементы выборки по возрастанию или убыванию и взяв средний элемент. Например, выборка <11, 9, 3, 5, 5>после упорядочивания превращается в <3, 5, 5, 9, 11>и её медианой является число 5. Если в выборке чётное число элементов, медиана может быть не определена однозначно: для числовых данных чаще всего используют полусумму двух соседних значений (то есть медиану набора <1, 3, 5, 7>принимают равной 4).

Другими словами, медианой в статистике называется значение, которое делит ряд пополам таким образом, что по обе стороны от нее (вниз или вверх) расположено одинаковое число единиц данной совокупности.

дециль

Дециль характеризует распределение величин совокупности, при котором девять значений дециля делят ее на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля от 90 % наибольших величин, лежащих выше дециля.

Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определенному интервалу и имеет вполне определенное значение .

Формула процентиля

Процентиль = n(x≤X)/N*100

n(x≤X) — число студентов, получивших бал не менее X ,

Читайте также:  Вводим в ячейку число как текст

X — количество балов конкретного студента, процентиль которого находим ,

N — число всех студентов .

Для удобства вычислений ранжируем выборку балов от максимального значения до минимального ( в порядке убывания): 5,5,5,4,4,4,4,4,4,4,4,3,3,3,3,3,3,2,2,2

Допустим нам необходимо определить процентиль студента Иванова получившего на экзамене 5 баллов:

Находим n(x≤X)=n(x≤5)=20 — т.е. 20 студентов получили бал не выше 5, тода

Процентиль (Иванова) = 20/20*100=100

Допустим необходимо определить процентиль студента Петрова получившего на экзамене 4 балла:

Находим n(x≤X)=n(x≤4)=17 — т.е. 17 студентов получили бал не выше 4, тода

Процентиль (Петрова) = 17/20*100=85

Допустим необходимо определить процентиль студента Сидорова получившего на экзамене 3 балла:

Находим n(x≤X)=n(x≤3)=9 — т.е. 9 студентов получили бал не выше 3, тода

Процентиль (Иванова) = 9/20*100=45

После расчета процентиля можно составить таблицу стандартизации. Для наших баллов она будет выглядеть следующим образом:

Алгоритм расчета процентилей

1. Для каждого человека посчитать, какое количество человек набрало столько же или меньше баллов.

2. Посчитать сколько процентов составляет это количество от всей выборки.

Процентиль – это процент людей из выборки, набравших столько же или меньше баллов, чем конкретный человек.

Процентиль является достаточно распространенной шкалой стандартизации, среди психологов, социологов, биологов, медиков и т.д., т.к. очень удобен и понятен. Его диапазон от 1 до 100.

Процентили указывают на относительное положение индивида в выборке стандартизации. Их также можно рассматривать, как ранговые градации, общее число которых равно 100, с той лишь разницей, что при ранжировании принято начинать отсчет сверху, т.е. с лучшего члена группы, получающего ранг 1. В случае же процентилей отсчет ведется снизу, поэтому, чем ниже процентиль, тем хуже позиция индивида.

Процентиль может использоваться для стандартизации как нормально распределенных случайных величин СВ, так и данных с ненормальным распределением.

Расчет процентилей в Excel

Для расчета процентилей нам понадобится функция СЧЕТЕСЛИ.

Для расчета, для каждого значения нужно ввести формулу:

=(СЧЁТЕСЛИ(диапазон;условие)*100)/N , где N – количество человек.

5.5 Мода и медиана. Их вычисление в дискретных и интервальных вариационных рядах

Если надо, например, узнать наиболее распространенный размер заработной платы на предприятии, цену на рынке, по которой было продано наибольшее количество товаров, размер ботинок, пользующийся наибольшим спросом у потребителей, и т.д., в этих случаях прибегают к моде.

Медиана интересна тем, что показывает количественную границу значение варьирующего признака, которую достигла половина членов совокупности. Пусть средняя заработная плата работников банка составила 650000 руб. в месяц. Эта характеристика может быть дополнена, если мы скажем, что половина работников получила заработную плату 700000 руб. и выше, т.е. приведем медиану. Мода и медиана являются типичными характеристиками в тех случаях, когда взяты совокупности однородные и большой численности.

Нахождение моды и медианы в дискретном вариационном ряду

Найти моду и медиану в вариационном ряду, где значения признака заданы определенными числами, не представляет большой трудности. Рассмотрим таблицу 1. с распределение семей по числу детей.

Таблица 1. Распределение семей по числу детей

Очевидно, в этом примере модой будет семья, имеющая двоих детей, так как этому значению варианты соответствует наибольшее число семей. Могут быть распределения, где все варианты встречаются одинаково часто, в этом случае моды нет или, иначе, можно сказать, что все варианты одинаково модальны. В других случаях не одна, а две варианты могут быть наибольшей частоты. Тогда будет две моды, распределение будет бимодальным. Бимодальные распределения могут указывать на качественную неоднородность совокупности по исследуемому признаку.

Чтобы найти медиану в дискретном вариационном ряд, нужно сумму частот разделить пополам и к полученному результату добавить ½. Так, в распределении 185 семьи по числу детей медианой будет: 185/2 + ½ = 93, т.е. 93-я варианта, которая делит упорядоченный ряд пополам. Каково же значение 93-ей варианты? Для того чтобы это выяснить, нужно накапливать частоты, начиная, от наименьшей варианты. Сумма частот 1-й и 2-й вариант равна 40. Ясно, что здесь 93 варианты нет. Если прибавить к 40 частоту 3-й варианты, то получим сумму, равную 40 + 75 = 115. Следовательно, 93-я варианта соответствует третьему значению варьирующего признака, и медианой будет семья, имеющая двоих детей.

Мода и медиана в данном примере совпали. Если бы у нас была четная сумма частот (например, 184), то, применяя указанную выше формулу, получим номер медианной варианты, 184/2 + ½ =92,5. Поскольку варианты с дробным номером не существует, полученный результат указывает, что медиана находится посередине между 92 и 93 вариантами.

3. Расчет моды и медианы в интервальном вариационном ряду

Описательный характер моды и медианы связан с тем, что в них не погашаются индивидуальные отклонения. Они всегда соответствуют определенной варианте. Поэтому мода и медиана не требуют для своего нахождения расчетов, если известны все значения признака. Однако в интервальном вариационном ряду для нахождения приближенного значения моды и медианы в пределах определенного интервала прибегают к расчетам.

Для расчета определенного значения модальной величины признака, заключенного в интервале, применяют формулу:

М о = Х Мо + i Мо *(f Мо – f Мо-1)/((f Мо – f Мо-1) + (f Мо – f Мо+1)),

Где Х Мо – минимальная граница модального интервала;

i Мо – величина модального интервала;

f Мо – частота модального интервала;

f Мо-1 – частота интервала, предшествующего модальному;

f Мо+1 – частота интервала, следующего за модальным.

Покажем расчет моды на примере, приведенном в таблице 2.

Таблица 2. Распределение рабочих предприятия по выполнению норм выработки

Чтобы найти моду, первоначально определим модальный интервал данного ряда. Из примера видно, что наибольшая частота соответствует интервалу, где варианта лежит в пределах от 100 до 105. Это и есть модальный интервал. Величина модального интервала равна 5.

Подставляя числовые значения из таблицы 2. в указанную выше формулу, получим:

М о = 100 + 5 * (104 -12)/((104 – 12) + (104 – 98)) = 108,8

Смысл этой формулы заключается в следующем: величину той части модального интервала, которую нужно добавить к его минимальной границе, определяют в зависимости от величины частот предшествующего и последующего интервалов. В данном случае к 100 прибавляем 8,8, т.е. больше половины интервала, потому что частота предшествующего интервала меньше частоты последующего интервала.

Исчислим теперь медиану. Для нахождения медианы в интервальном вариационном ряду определяем сначала интервал, в котором она находится (медианный интервал). Таким интервалом будет такой, комулятивная частота которого равна или превышает половину суммы частот. Комулятивные частоты образуются путем постепенного суммирования частот, начиная от интервала с наименьшим значением признака. Половина суммы частот у нас равна 250 (500:2). Следовательно, согласно таблицы 3. медианным интервалом будет интервал со значением заработной платы от 350000 руб. до 400000 руб.

Таблица 3. Расчет медианы в интервальном вариационном ряду

До этого интервала сумма накопленных частот составила 160. Следовательно, чтобы получить значение медианы, необходимо прибавить еще 90 единиц (250 – 160).

При определении значения медианы предполагают, что значение единиц в границах интервала распределяется равномерно. Следовательно, если 115 единиц, находящихся в этом интервале, распределяются равномерно в интервале, равном 50, то 90 единицам будет соответствовать следующая его величина:

Читайте также:  Калькулятор величин и конвертер единиц измерений ПРЕОБР в Excel

Примеры использования функции МЕДИАНА в Excel

При исследовании возрастных групп студентов использовались данные случайно выбранной группы учащихся в ВУЗе. Задача – определить срединный возраст студентов.

Формула для расчета:

  • B3:B15 – диапазон исследуемых возрастов.

То есть в группе есть студенты, возраст которых меньше 21 года и больше этого значения.

Особенности использования функции МЕДИАНА в Excel

Функция имеет следующий синтаксис:

  • число1 – обязательный аргумент, характеризующий первое числовое значение, содержащееся в исследуемом диапазоне;
  • [число2] – необязательный второй (и последующие аргументы, всего до 255 аргументов), характеризующий второе и последующие значения исследуемого диапазона.
  1. При расчетах удобнее передавать сразу весь диапазон исследуемых значений вместо последовательного ввода аргументов.
  2. В качестве аргументов принимаются данные числового типа, имена, содержащие числа, данные ссылочного типа и массивы (например, =МЕДИАНА(<1;2;3;5;7;10>)).
  3. При расчете медианы учитываются ячейки, содержащие пустые значения или логические ИСТИНА, ЛОЖЬ, которые будут интерпретированы как числовые значения 1 и 0 соответственно. Например, результат выполнения функции с логическими значениями в аргументах (ИСТИНА;ЛОЖЬ) эквивалентен результату выполнения с аргументами (1;0) и равен 0,5.
  4. Если один или несколько аргументов функции принимают текстовые значения, которые не могут быть преобразованы в числовые, или содержат коды ошибок, результатом выполнения функции будет код ошибки #ЗНАЧ!.
  5. Для определения медианы выборки могут быть использованы другие функции Excel: ПРОЦЕНТИЛЬ.ВКЛ, КВАРТИЛЬ.ВКЛ, НАИБОЛЬШИЙ Примеры использования:
  • =ПРОЦЕНТИЛЬ.ВКЛ(A1:A10;0,5), поскольку по определению медиана – 50-я процентиль.
  • =КВАРТИЛЬ.ВКЛ(A1:A10;2), так как медиана – 2-я квартиль.
  • =НАИБОЛЬШИЙ(A1:A9;СЧЁТ(A1:A9)/2), но только если количество чисел в диапазоне является нечетным числом.
  1. Если в исследуемом диапазоне все числа распределены симметрично относительно среднего значения, среднее арифметическое и медиана для данного диапазона будут эквивалентны.
  2. При больших отклонениях данных в диапазоне («разбросе» значений) медиана лучше отражает тенденцию распределения значений, чем среднее арифметическое. Отличным примером является использование медианы для определения реального уровня зарплат у населения государства, в котором чиновники получают на порядок больше обычных граждан.
  3. Диапазон исследуемых значений может содержать:
  • Нечетное количество чисел. В этом случае медианой будет являться единственное число, разделяющее диапазон на два подмножества больших и меньших значений соответственно;
  • Четное количество чисел. Тогда медиана вычисляется как среднее арифметическое для двух числовых значений, разделяющих множество на два указанных выше подмножества.

Структурные (позиционные) средние – это средние величины, которые занимают определенное место (позицию) в ранжированном вариационном ряду.

Мода (Mo ) — это значение признака, наиболее часто встречающееся в исследуемой совокупности.

Для дискретных вариационных рядов модой будет значение варианты с наибольшей частотой

Пример . Определить моду по имеющимся данным (табл. 7.5).

Таблица 7.5 – Распределение женской обуви, проданной в обувном магазине N , февраль 2013 г.

По данным табл. 5 видно, что наибольшая частота f max = 28, ей соответствует значение признака x = 37 размер. Следовательно, Mo = 37 размер обуви, т.е. именно этот размер обуви пользовался наибольшим спросом, наиболее часто покупали обувь 37-го размера.

В сначала определяется модальный интервал , т.е. содержащий моду – интервал с наибольшей частотой (в случае интервального распределения с равными интервалами, в случае с неравными интервалами – по наибольшей плотности).

Модой приближенно считается середина модального интервала. Конкретное значение моды для интервального ряда определяется по формуле:

где x Mo – нижняя граница модального интервала;

i Mo – величина модального интервала;

f Mo – частота модального интервала;

f Mo -1 – частота интервала, предшествующего модальному;

f Mo +1 – частота интервала, следующего за модальным.

Пример . Определить моду по имеющимся данным (табл. 7.6).

Таблица 7.6 – Распределение работников по стажу

По данным табл. 6 видно, что наибольшая частота f max = 35, ей соответствует интервал: 6-8 лет (модальный интервал). Определим моду по формуле:

лет.

Следовательно, Mo = 6,8 лет, т.е. большинство работников имеют стаж 6,8 лет.

Название медианы взято из геометрии, где им именуется отрезок, соединяющий одну из вершин треугольника с серединой противоположной стороны и разделяющий, таким образом, сторону треугольника на две равные части.

Медиана ( ) это значение признака, приходящееся на середину ранжированной совокупности. Иначе медиана – это величина, которая делит численность упорядоченного вариационного ряда на две равные части – одна часть имеет значения варьирующего признака меньшие, чем средний вариант, а другая – большие.

Для ранжированного ряда (т.е.упорядоченного — построенного в порядке возрастания или убывания индивидуальных значений признака) с нечетным числом членов (n= нечет) медианой является варианта, расположенная в центре ряда. Порядковый номер медианы (N Me ) определяется следующим образом:

N Me =(n +1)/ 2.

Пример. В ряду из 51 члена номер медианы (51+1)/2 = 26, т.е. медианой является вариант, стоящий в ряду 26-ым по порядку.

Дляранжированного ряда с четным числом членов (n= чет) – медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда. Порядковые номера двух центральных вариант определяются следующим образом:

N Me 1 =n/ 2; N Me 2 =(n/ 2)+ 1.

Пример. При n=50; N Me1 = 50/2 = 25; N Me2 = (50/2)+1 = 26, т.е. медианой является средняя из вариант, стоящих в ряду 25-ой и 26-ой по порядку.

В дискретных вариационных рядах медиана находится по накопленной частоте, соответствующей порядковому номеру медианы или впервые его превышающей. Иначе по накопленной частоте равной или впервые превышающей половину суммы всех частот ряда.

Пример . Определить медиану по имеющимся данным (табл. 7.7).

Таблица 7.7 – Распределение женской обуви, проданной в обувном магазине N , февраль 2013 г.

По данным табл. 7 определим порядковый номер медианы: N Me =( 67+1)/2=34.

Пример расчета медианы при статистическом анализе в Excel

Пример 3. В магазине работают 3 продавца. По результатам последних 10 дней необходимо определить работника, которому будет выдана премия. При выборе лучшего работника учитывается степень эффективности его работы, а не число проданных товаров.

Исходная таблица данных:

Для характеристики эффективности будем использовать сразу три показателя: среднее значение, медиана и мода. Определим их для каждого работника с использованием формул СРЗНАЧ, МЕДИАНА и МОДА соответственно:

Для определения степени разброса данных используем величину, которая является суммарным значением модуля разницы среднего значения и моды, среднего значения и медианы соответственно. То есть коэффициент x=|av-med|+|av-mod|, где:

  • av – среднее значение;
  • med – медиана;
  • mod – мода.

Рассчитаем значение коэффициента x для первого продавца:

Аналогично проведем расчеты для остальных продавцов. Полученные результаты:

Определим продавца, которому будет выдана премия:

Примечание: функция НАИМЕНЬШИЙ возвращает первое минимальное значение из рассматриваемого диапазона значений коэффициента x.

Коэффициент x является некоторой количественной характеристикой стабильности работы продавцов, которую ввел экономист магазина. С его помощью удалось определить диапазон с наименьшими отклонениями значений. Этот способ демонстрирует, как можно использовать сразу три метода определения центральной тенденции для получения наиболее достоверных результатов.

Ссылка на основную публикацию