Статистические Калькуляторы
Калькулятор среднего арифметического, медианы, моды


Калькулятор среднего арифметического, медианы, моды

Калькулятор среднего, медианы и моды в статистике. Используйте этот калькулятор, чтобы получить среднее арифметическое, медиану, моду, размах и среднее значение для любого набора данных.

Результат
Среднее x̄ 16.75 Выбросы 6, 33, 35
Медиана x̃ 15 Квартиль Q1 12.5
Мода 15 появилось 3 раза Квартиль Q2 15
Размах 29 Квартиль Q3 16
Минимум 6 Межквартильный размах IQR 3.5
Максимум 35
Сумма 201
Количество n 12

Произошла ошибка при расчете.

Содержание

  1. Меры центральной тенденции
  2. Калькулятор среднего арифметического
  3. Cреднее для выборки и для генеральной совокупности
  4. Пример вычисления среднего арифметического
  5. Калькулятор медианы
  6. Пример вычисления медианы
  7. Важность разницы между средним и медианой
  8. Калькулятор моды
  9. Пример вычисления моды
  10. Меры дисперсии
  11. Калькулятор размаха
  12. Пример вычисления размаха
  13. Калькулятор квартилей
    1. Расчет квартилей
  14. Пример вычисления квартилей
  15. Калькулятор межквартильного размаха
  16. Пример вычисления IQR
  17. Результаты

Калькулятор среднего арифметического, медианы, моды

Меры центральной тенденции

Глядя на таблицы и графики статистических данных нам бывает, трудно их интерпретировать. Чтобы получить больше полезной информации из статистики, нам часто нужно обобщить наборы данных и выявить их важные особенности.

В статистике для обобщения данных используются разные меры. Некоторые из них описывают центр данных; они называются мерами центральной тенденции. Другие описывают, насколько разбросаны значения данных; они называются мерами разброса. Другие, называемые мерами положения, выявляют долю данных, которая меньше заданного значения.

Основная цель этого калькулятора — вычислить меры центральной тенденции - среднее и медиану, которые могут представлять типичное или центральное значение в наборе данных. Второстепенная цель этого калькулятора - определение степени разброса в наборе данных с помощью вычисления размаха, квартилей и межквартильного диапазона.

Калькулятор среднего арифметического

Среднее значение - это сумма значений, поделенная на общее количество значений. Его проще всего понять и рассчитать, используя следующую формулу вычисления среднего для выборки:

$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$

Формула среднего для генеральной совокупности:

$$\mu=\frac{x₁+x₂+x₃+\ldots+x_n}{N}=\frac{\sum_{}^{}x}{N}$$

Здесь числитель представляет собой сумму значений в наборе данных. А знаменатель представляет количество значений в наборе данных.

Основной особенностью использования среднего арифметического является то, что оно задействует все точки данных, присутствующие в наборе данных.

Основным ограничением среднего арифметического является то, что оно очень чувствительно к экстремальным значениям, которые слишком велики или слишком малы. Такие значения известны как выбросы, и они сильно влияют на среднее значение.

Обратите также внимание на то, что среднее значение необязательно является типичным значением для данных. На самом деле, средним значением может быть значение, которое вообще не присутствует в наборе данных.

Cреднее для выборки и для генеральной совокупности

Напомним, что генеральная совокупность состоит из всей совокупности значений, о которых ищется информация, а выборка - из меньшей группы, взятой из генеральной совокупности.

Метод расчета среднего значения одинаков как для выборок, так и для генеральных совокупностей. Различаются только обозначения.

Если x₁, x₂,..., xₙ - выборка, то среднее называется выборочным средним и обозначается символом ̄x̄.

Среднее значение генеральной совокупности обозначается греческой буквой 𝜇.

Помните, что в статистике мы используем использовать строчную букву n для обозначения размера выборки и прописную N для обозначения размер генеральной совокупности.

Пример вычисления среднего арифметического

Давайте рассмотрим следующий пример. Луиджи - первоклассный шеф-повар и фанат пиццы. Он решил открыть свою собственную пиццерию на Бали. Для того чтобы найти инвестора, он пишет бизнес-план. И для выявления будущих финансовых показателей он хочет определить среднюю стоимость пиццы в разных ресторанчиках на острове.

Он провел небольшое исследование о цене на пиццу Маргарита в ресторанах на Бали и получил набор данных из цен на пиццу. Для простоты расчетов отбросим последние три нуля и укажем количество тысяч в цене. То есть 60 в наших вычислениях будет означать 60.000 индонезийских рупий.

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

Луиджи не объехал все пиццерии на острове. Он в случайном порядке 20 из них. Таким образом мы имеем дело с выборкой.

Вычислим среднее значение для этого набора данных по формуле:

$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$

В итоге мы получим x̄ = 71,9.

71.900 индонезийских рупий - средняя цена на пиццу Маргарита на Бали исходя из исследования Луиджи. Теперь он может ориентироваться на эту цену составляя свои расчеты.

Калькулятор медианы

Медиана — это позиционная мера, представляющая среднее значение набора данных, расположенного по возрастанию или по убыванию.

Вычисляя медиану, мы пытаемся найти число, которое делит набор данных пополам. Половина значений данных оказывается меньше медианы и половина значений данных оказывается больше медианы. Именно поэтому, когда мы определяем медиану вручную без калькулятора медианы, нам важно сортировать значения в порядке возрастания или убывания.

Процедура вычисления медианы отличается в зависимости от того, является ли количество наблюдений в наборе данных четным или нечетным.

Если общее количество элементов нечетно, то есть n или N нечетно, то применима следующая формула:

$$Медиана=(\frac{n+1}{2})-й \ элемент$$

Однако, если количество элементов четное, что означает, что n является четным числом, то используется следующая формула:

$$Медиана=\frac{\left[(\frac{n}{2})-й \ элемент+(\frac{n}{2}+1)-й \ элемент\right]}{2}$$

Основное преимущество использования медианы заключается в том, что на нее меньше всего влияют экстремально высокие или экстремально низкие значения.

Пример вычисления медианы

Для заданного набора из двадцати значений,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

мы можем вычислить медиану так:

  1. Расположим набор данных в порядке возрастания или убывания. Здесь порядок выглядит следующим образом:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

  1. Определим количество значений в наборе данных. У нас n = 20.

  2. Если n нечетное, выбираем среднее значение данных в качестве медианы. Если n четное, находим среднее арифметическое двух средних значений. То есть складываем их и делим полученную сумму на 2. 20 - четное число.

Средние значения в нашей выборке 69 и 70. Мы находим медиану таким образом:

$$Медиана = \frac{69 + 70}{2} = 69,5$$

Если бы у Луиджи был набор из 21 значения, например

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 90, 55, 72, 70

он мог бы упорядочить значения:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 90, 95, 120, 160

и выбрать значение, оказавшееся в центре, на 11-й позиции, то есть 70.

Важность разницы между средним и медианой

И среднее, и медиана используются в качестве мер центральной тенденции. Но важно знать, чем они отличаются.

Одно из важных различий между средним и медианой заключается в том, что формула для среднего использует все значения в наборе данных, а формула для медианы зависит только от среднего числа или двух средних чисел.

Это особенно важно для наборов данных, в которых одно или несколько чисел необычайно велики или необычайно малы. Такие числа называются выбросами. В большинстве случаев эти выбросы будут оказывать большое влияние на среднее значение, но они будут слабо влиять на медиану или не влиять на нее вообще.

В статистике мы говорим, что меры устойчива, если на ее значение не оказывают большого влияния экстремальные значения в наборе данных. Поэтому мы можем сказать, что медиана устойчива, а среднее - неустойчиво.

Среднее и медиана измеряют центр набора данных по-разному. Среднее значение - это точка, относительно которой набор данных балансирует. Медиана - это среднее число, разделяющее 50% данных по одну сторону и 50% данных по другую сторону. Когда набор данных симметричен, среднее и медиана оказываются равны. Но они могут быть и не равны.

В некоторых наборах данных среднее значение может быть меньше медианы или медиана может быть меньше среднего значения. В этом случае мы говорим, что в наборе данных есть перекос.

Если среднее значение левее или меньше медианы, мы говорим о том, что в наборе данных перекос влево. Если среднее значение справа от медианы или больше ее в наборе данных наблюдается перекос вправо.

Из этих двух мер центральной тенденции, ни среднее, ни медиана не лучше. Они обе измеряют центр разными способами. Когда данные сильно перекошены или содержат экстремальные значения, некоторые специалисты предпочитают использовать медиану, потому что медиана более репрезентативна для типичного значения.

Калькулятор моды

Мода — это значение набора данных, которое встречается в наборе данных максимальное количество раз. То есть наиболее часто встречающееся значение.

Набор данных, в котором есть только одно значение, встречающееся с наибольшей частотой, называется унимодальным.

Если набор данных имеет два значения, которые встречаются с одинаковой наибольшей частотой, тогда оба значения считаются модой, и набор данных считается бимодальным.

Если набор данных имеет более двух значений, которые встречаются с одинаковой наибольшей частотой, тогда каждое значение используется в качестве моды, и набор данных считается мультимодальным.

Если ни одно значение данных не встречается более одного раза, говорят, что набор данных не имеет моды. При этом будет неверно говорить, что мода равна нулю. Это будет неверно, поскольку в некоторых данных, например, в измерениях температуры, нуль может оказаться фактическим значением.

Основным преимуществом вычисления моды является то, что ее проще всего вычислять и на нее не влияют экстремальные значения. Недостатком моды является то, что в определенных ситуациях для некоторых наборов данных значения моды может не существовать.

Пример вычисления моды

Для заданного набора из двадцати значений,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

мы можем вычислить моду следующим образом:

Расположим набор данных в порядке возрастания или убывания. Здесь порядок выглядит следующим образом:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

Далее находим значение, повторяющееся максимальное количество раз. Здесь наиболее часто встречается значение 70. Следовательно, для данного набора данных модальное значение равно 70.

Моду иногда называют мерой средней тенденции. Но это не совсем точно. Мода может быть самым большим значением в наборе данных или наименьшим, или любым другим. Например, если бы у нас в наборе данных были бы следующие числа:

42, 45, 50, 53, 55, 57, 59, 60, 63, 69, 70, 72, 79, 82, 83, 95, 96, 120, 120, 120

мода была бы равна 120. Хотя в данном случае она не отображала бы центральную тенденцию.

Интересно, что среднее и медиану можно рассчитать только для количественных данных. А моду можно рассчитать и для количественных данных и для качественных.

Например, Анна съедает в месяц пиццу в среднем 12 раз.

  • 3 раза пиццу Неаполетана
  • 3 раза пиццу Маргарита
  • 2 разa пиццу Кальцоне
  • 1 раз пиццу Пепперони
  • 1 раз пиццу Маринара
  • 1 раз пиццу Четыре сыра
  • 1 раз пиццу Капрезе

В этом случае у нас будет две моды - а именно пицца Napoletana и пицца Margherita.

Меры дисперсии

Мы используем меры дисперсии для определения изменчивости в наборе данных. Обычно они отражают степень разброса данных от центрального значения. Мы можем исследовать дисперсию в наборе данных, используя размах, квартили и межквартильный размах.

Калькулятор размаха

Размах для набора данных — это разница между наибольшим и наименьшим значением в наборе данных. Мы можем вычислить его, определив максимальное и минимальное значения набора данных. Формула для расчета размаха:

$$Размах = наибольшее\ значение - наименьшее\ начение$$

Пример вычисления размаха

Для заданного набора из двадцати значений,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70,

мы можем вычислить размах следующим образом:

Расположим набор данных в порядке возрастания или убывания. Здесь порядок выглядит так:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

Далее, наибольшее значение равно 160, а наименьшее — 42. Следовательно, размах:

Размах = наибольшее значение - наименьшее значение = 160 - 42 = 118

Следовательно, для данного набора данных размах равен 118.

Калькулятор квартилей

Квартили — это значения, которые делят набор данных на четыре четверти по трем точкам, а именно на первый, второй и третий квартили.

Первый квартиль, обозначенный Q₁, представляет собой точку, представляющую первые 25% значений набора данных, которые меньше этого значения. А остальные 75% значений больше.

Второй квартиль, обозначенный Q₂, является медианой. Это означает, что 50% набора данных меньше этого значения, а остальные 50% больше Q₂.

Третий квартиль, обозначаемый Q₃, представляет собой точку, представляющую 75% значений, которые меньше этого значения, а остальные 25% — больше.

Расчет квартилей

Процедура вычисления квартилей набора данных

  1. Расположите данные в порядке возрастания.

  2. Чтобы вычислить второй квартиль, просто вычислите медиану.

  3. Для первого и третьего квартилей действуйте следующим образом. Определите n - количество значений в наборе данных.

  4. Для первого квартиля вычислите L = 0,25n. Для третьего квартиля вычислите L = 0,75n.

  5. Если L - целое число, квартиль представляет собой среднее значение числа в позиции L и числа в позиции L + 1.

  6. Если L - не целое число, округлите его до следующего большего целого числа. Квартиль - это число в позиции, соответствующей округленному значению.

Пример вычисления квартилей

Для данного набора из двадцати значений,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

мы можем вычислить квартили следующим образом:

  1. Расположим набор данных в порядке возрастания или убывания. Здесь порядок выглядит так:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

  1. Из предыдущих вычислений мы уже знаем что

Медиана = 70

  1. L для первого квартиля: 0,25 × 20 = 5. L для третьего квартиля 0,75 × 20 = 15.

  2. 5 это целое число, поэтому Q₁ в нашем случае это:

$$Q₁=\frac{55+59}{2}=57$$

  1. 15 тоже целое число, поэтому Q₃ в нашем случае это

$$Q₃=\frac{72+75}{2}=73,5$$

Следовательно, для данного набора данных первый квартиль равен 57, второй 70, а третий 73,5.

Калькулятор межквартильного размаха

Межквартильный размах (inter-quartile range, IQR) — это разница между третьим (Q₃) и первым (Q₁) квартилями набора данных. Это показатель среднего разброса, вычислить который можно следующим образом:

IQR = Q₃ - Q₁

Пример вычисления IQR

В предыдущем разделе мы уже вычислили первый и третий квартили. Они равны 57 и 73,5. Все, что нам осталось сделать, это просто применить формулу.

IQR = Q₃ - Q₁ = 73,5 - 57 = 16,5

Таким образом, для данного набора данных межквартильный размах равен 16,5.

Результаты

В нашем случае с мини-исследованием Луиджи о ценах на пиццу Маргарита он мог сделать следующие выводы. Среднее и медиана не совпали, образовался небольшой перекос данных. Но он не очень заметный. Поэтому и среднее и медиану можно было бы использовать в качестве меры среднего значения.

Если Луиджи хотел бы ориентироваться на среднюю цену на пиццу Маргарита, то стоило бы взять или среднее или медиану. Но 71.900 рупий или 69.500 рупий были бы не очень удобны в качестве запоминающейся цены на пиццу. К счастью мода цены на пиццу Маргарите как раз лежит в этом пределе и равняется 70.000 рупий. Поэтому Луиджи мог бы использовать именно эту цену в своих расчетах.

Если же он хотел бы создать пиццерию для более экономной публики, он мог бы ориентироваться на показатели ближе к первому квартилю. То есть на цену в районе 57.000 рупий. Ориентироваться на третий квартиль для определения цены для более требовательных клиентов не очень удобно, поскольку третий квартиль не очень репрезентативен.