Kalkulatory Statystyczne
Kalkulator średniej, mediany, mody


Kalkulator średniej, mediany, mody

Kalkulator do obliczania średniej, mediany, mody, zakresu oraz średniej dla dowolnego zbioru danych.

Wynik
Średnia x̄ 16.75 Wartości odstające 6, 33, 35
Mediana x̃ 15 Kwartyl Q1 12.5
Moda 15 pojawiło się 3 razy Kwartyl Q2 15
Zakres 29 Kwartyl Q3 16
Minimum 6 Rozstęp międzykwartylowy IQR 3.5
Maksimum 35
Suma 201
Liczba n 12

Wystąpił błąd w twoim obliczeniu.

Spis treści

  1. Miary tendencji centralnej
  2. Kalkulator średniej
  3. Średnia dla próbki i populacji
  4. Przykład obliczania średniej
  5. Kalkulator mediany
  6. Przykład obliczenia mediany
  7. Różnica między średnią a medianą
  8. Kalkulator mody
  9. Przykład obliczenia mody
  10. Miary rozproszenia
  11. Kalkulator zakresu
  12. Przykład obliczania zakresu
  13. Kalkulator kwartyli
    1. Obliczanie kwartyli
  14. Przykład obliczenia kwartyli
  15. Kalkulator rozstępu międzykwartylowego
  16. Przykład obliczenia IQR
  17. Wyniki

Kalkulator średniej, mediany, mody

Miary tendencji centralnej

Analiza tabel i wykresów danych statystycznych może być dla nas trudna do interpretacji. Często musimy podsumować zbiory danych i zidentyfikować ważne cechy, aby uzyskać bardziej użyteczne informacje ze statystyk.

W statystyce różne miary są używane do podsumowania danych. Niektóre opisują centrum danych; nazywane są miarami tendencji centralnej. Inne mówią o tym, jak rozrzucone są wartości danych; nazywane są miarami rozproszenia. Inne, zwane miarami pozycji, ujawniają proporcję danych, która jest mniejsza niż dana wartość.

Podstawowym celem tego kalkulatora jest obliczenie miar tendencji centralnej – średniej i mediany – które mogą reprezentować typową lub centralną wartość w zestawie danych. Drugorzędnym celem kalkulatora jest określenie stopnia zmienności w zbiorze danych poprzez obliczenie zakresu, kwartyli i zakresu międzykwartylowego.

Kalkulator średniej

Średnia to suma wartości podzielona przez całkowitą liczbę wartości. Jest najłatwiejsza do zrozumienia i obliczenia, używając następującej formuły do obliczenia średniej dla próbki:

$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum{x}}{n}$$

Formuła dla średniej dla populacji wygląda następująco:

$$\mu=\frac{x₁+x₂+x₃+\ldots+x_n}{N}=\frac{\sum{x}}{N}$$

Tu, licznik reprezentuje sumę wartości w zbiorze danych. A mianownik reprezentuje liczbę wartości w zbiorze danych.

Główną cechą używania średniej arytmetycznej jest to, że obejmuje wszystkie punkty danych obecne w zbiorze danych.

Głównym ograniczeniem średniej jest to, że jest ona podatna na wartości ekstremalne, które są albo zbyt duże, albo zbyt małe. Takie wartości są znane jako wartości odstające i znacząco wpływają na średnią.

Należy również zauważyć, że wartość średnia niekoniecznie jest typową wartością dla danych. Wartość średnia może być wartością, która w ogóle nie występuje w zestawie danych.

Średnia dla próbki i populacji

Populacja składa się z całego zestawu wartości, na temat których uzyskuje się informacje. Próbka składa się z mniejszej grupy wybranej z populacji.

Metoda obliczania wartości średniej jest taka sama zarówno dla próbek, jak i populacji. Różnią się tylko oznaczenia.

Jeśli x₁, x₂,..., xₙ to próbka, średnia nazywana jest średnią próbki i jest oznaczona symbolem x̄. Średnia populacji jest oznaczona grecką literą 𝜇.

W statystyce używamy małej litery n do oznaczenia rozmiaru próbki i wielkiej litery N do oznaczenia wielkości populacji.

Przykład obliczania średniej

Spójrzmy na następujący przykład: Luigi jest wybitnym szefem kuchni i miłośnikiem pizzy. Postanowił otworzyć swoją pizzerię na Bali. Aby znaleźć inwestora, Luigi pisze plan biznesowy. Chce ustalić średni koszt pizzy w różnych restauracjach na wyspie, aby ocenić przyszłą wydajność finansową.

Przeprowadził małe badanie na temat ceny pizzy Margherita w restauracjach na Bali i uzyskał zestaw danych cen pizzy. Dla ułatwienia obliczeń pomijamy ostatnie trzy zera i używamy liczby tysięcy w cenie. To znaczy, 60 w naszych obliczeniach oznacza 60 000 indonezyjskich rupii.

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

Luigi nie odwiedził każdej pizzerii na wyspie. Losowo wybrał 20 z nich. Zatem mamy do czynienia z próbką.

Obliczmy średnią wartość dla tego zbioru danych, używając formuły:

$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum{x}}{n}$$

Otrzymujemy średnią x̄ = 71,9.

Badanie Luigi'ego pokazuje, że średnia cena pizzy Margherita na Bali wynosi 71.900 indonezyjskich rupii. Może teraz opierać swoje kalkulacje na tej cenie.

Kalkulator mediany

Mediana to miara pozycyjna reprezentująca wartość środkową uporządkowanego zbioru danych w kolejności rosnącej lub malejącej.

Obliczając medianę, staramy się znaleźć liczbę, która dzieli zbiór danych na pół. Połowa wartości danych jest mniejsza niż mediana, a połowa większa. Dlatego gdy ręcznie określamy medianę bez kalkulatora mediany, musimy uporządkować wartości w kolejności rosnącej lub malejącej.

Obliczanie mediany różni się w zależności od tego, czy liczba wartości w zbiorze danych jest parzysta czy nieparzysta.

Jeśli całkowita liczba elementów jest nieparzysta, czyli n lub N jest liczbą nieparzystą, wówczas stosuje się następującą formułę:

$$Mediana=(\frac{n+1}{2})-ty \ element$$

Jeśli jednak liczba elementów jest parzysta, co oznacza, że n jest liczbą parzystą, wówczas używamy następującej formuły:

$$Mediana=\frac{\left[(\frac{n}{2})-ty \ element+(\frac{n}{2}+1)-ty \ element\right]}{2}$$

Główną zaletą stosowania mediany jest to, że jest ona najmniej podatna na wpływ wartości ekstremalnie wysokich lub niskich.

Przykład obliczenia mediany

Dla danego zbioru dwudziestu wartości,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

możemy obliczyć medianę w następujący sposób:

  1. Uporządkuj zbiór danych rosnąco lub malejąco. Tutaj kolejność jest następująca:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

  1. Określmy liczbę wartości w zbiorze danych. Mamy n = 20.

  2. Jeśli n jest nieparzyste, wybieramy centralną wartość danych jako medianę. Jeśli n jest parzyste, znajdujemy średnią arytmetyczną dwóch środkowych wartości. Dodajemy je i dzielimy sumę przez 2.

20 jest liczbą parzystą.

Centralne wartości w naszej próbce to 69 i 70. W ten sposób znajdujemy medianę:

$$Mediana = \frac{69 + 70}{2} = 69,5$$

Gdyby Luigi miał zbiór 21 wartości, np.

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 90, 55, 72, 70

Mógłby uporządkować wartości:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 90, 95, 120, 160

i wybrać wartość centralną na 11. pozycji, czyli 70.

Różnica między średnią a medianą

Zarówno średnia, jak i mediana są używane jako miary tendencji centralnej. Ale istotne jest, aby wiedzieć, jak się różnią.

Jedna zasadnicza różnica między średnią a medianą polega na tym, że formuła na średnią używa wszystkich wartości w zbiorze danych, podczas gdy formuła na medianę zależy tylko od centralnej liczby lub dwóch centralnych liczb.

Jest to szczególnie ważne dla zbiorów danych, w których jedna lub więcej liczb jest niezwykle duża lub mała. Takie liczby nazywane są wartościami odstającymi. W większości przypadków te wartości odstające znacząco wpłyną na średnią, ale będą miały niewielki lub żaden wpływ na medianę.

W statystyce mówimy, że miara jest odporna, jeśli jej wartość nie jest znacząco zakłócona przez ekstremalne wartości w zbiorze danych. Dlatego możemy powiedzieć, że mediana jest odporna, a średnia nie jest odporna.

Średnia i mediana mierzą centrum zbioru danych w różny sposób. Średnia jest punktem, w którym zbiór danych się równoważy. Mediana to średnia, która oddziela 50% danych po jednej stronie od 50% danych po drugiej stronie. Kiedy zbiór danych jest symetryczny, średnia i mediana są równe.

Jednak średnia i mediana mogą nie być sobie równe.

W niektórych zbiorach danych średnia może być mniejsza od mediany lub mediana może być mniejsza od średniej. W takim przypadku mówimy, że zbiór danych jest skośny.

Jeśli średnia wartość jest położona po lewej stronie lub jest mniejsza od mediany, mówimy, że zbiór danych jest skośny w lewo. Jeśli średnia jest położona po prawej stronie lub jest większa od mediany, mówimy, że zbiór danych jest skośny w prawo.

Ani średnia, ani mediana nie jest lepsza jako miara tendencji centralnej. Obie mierzą centrum na różne sposoby. Niektórzy eksperci wolą używać mediany, gdy dane są bardzo skośne lub zawierają ekstremalne wartości, ponieważ mediana jest bardziej reprezentatywna dla typowej wartości.

Kalkulator mody

Moda to wartość w zbiorze danych, która pojawia się najwięcej razy. Moda zbioru danych to wartość, która występuje najczęściej.

Zbiór danych jest unimodalny, jeśli ma jedną wartość, która pojawia się częściej niż jakakolwiek inna.

Jeśli zbiór danych ma dwie wartości o tej samej najwyższej częstotliwości, to obie wartości są uważane za modalne, a zbiór danych uważa się za bimodalny.

Jeśli zbiór danych ma więcej niż dwie wartości o tej samej najwyższej częstotliwości, to każda z tych wartości jest traktowana jako moda, a zbiór danych uważany jest za multimodalny.

Jeśli w zbiorze danych żadna pojedyncza wartość danych nie występuje więcej niż raz, mówi się, że zbiór danych nie ma mody. W takim przypadku byłoby nieprawidłowe twierdzenie, że moda wynosi zero. W rzeczywistości zero może być rzeczywistą wartością w niektórych zbiorach danych, takich jak pomiary temperatury.

Główną zaletą obliczania mody jest to, że jest najłatwiejsza do znalezienia i nie jest wpływana przez wartości ekstremalne. Wadą obliczania mody jest to, że w niektórych sytuacjach wartość modalna może nie istnieć dla niektórych zbiorów danych.

Przykład obliczenia mody

Dla danego zbioru dwudziestu wartości,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

Możemy znaleźć modę następująco:

Uporządkuj zbiór danych w kolejności rosnącej lub malejącej. Tutaj kolejność jest następująca:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

Następnie znajdujemy wartość, która pojawia się najwięcej razy. Tutaj wartość, która pojawia się najczęściej to 70. W związku z tym dla danego zbioru danych wartość modalna to 70.

Chociaż moda jest miarą tendencji centralnej, nie zawsze może odzwierciedlać centralną wartość rozkładu, zwłaszcza w rozkładach skośnych. Moda może być największą wartością w zbiorze danych, najmniejszą wartością lub jakąkolwiek inną wartością. Na przykład, jeśli mielibyśmy w zbiorze danych następujące liczby:

42, 45, 50, 53, 55, 57, 59, 60, 63, 69, 70, 72, 79, 82, 83, 95, 96, 120, 120, 120

Modą byłoby 120. Chociaż w tym przypadku nie odzwierciedlałoby to tendencji centralnej.

Co ciekawe, możemy obliczyć średnią i medianę tylko dla danych ilościowych. A modę możemy obliczyć zarówno dla danych ilościowych, jak i jakościowych.

Przeciętnie Anna je pizzę 12 razy na miesiąc.

  • 3 razy pizzę Neapolitańską,
  • 3 razy pizzę Margherita,
  • 2 razy pizzę Calzone,
  • 1 Pepperoni,
  • 1 Marinara,
  • 1 Cztery Sery,
  • 1 Caprese.

W tym przypadku będziemy mieli dwie mody: pizzę Neapolitańską i pizzę Margherita.

Miary rozproszenia

Miary rozproszenia, znane również jako miary zmienności, są używane do określenia rozkładu lub zmienności wewnątrz zestawu danych. Zazwyczaj odzwierciedlają stopień zmienności danych od wartości centralnej. Możemy zbadać zmienność zestawu danych, używając zakresu, kwartyli oraz rozstępu międzykwartylowego.

Kalkulator zakresu

Zakres dla zestawu danych to różnica między najwyższą a najniższą wartością w zestawie danych. Możemy go obliczyć, określając maksymalne i minimalne wartości zestawu danych. Formuła do obliczania zakresu to:

$$Zakres = Największa\ wartość - Najmniejsza\ wartość$$

Przykład obliczania zakresu

Dla danego zestawu dwudziestu wartości,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

możemy obliczyć zakres następująco:

Uporządkuj zestaw danych w kolejności rosnącej lub malejącej. Tutaj, kolejność wygląda tak:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

Dalej, najwyższa wartość to 160, a najniższa to 42. Stąd zakres:

$$Zakres = największa\ wartość - najmniejsza\ wartość = 160 - 42 = 118$$

Zatem dla tego zestawu danych, zakres wynosi 118.

Kalkulator kwartyli

Kwartyle to wartości, które dzielą zestaw danych na cztery części przez trzy punkty, a mianowicie pierwszy, drugi i trzeci kwartyl.

Pierwszy kwartyl, oznaczony jako Q₁, to wartość, poniżej której spada 25% danych, z pozostałymi 75% leżącymi powyżej.

Drugi kwartyl, oznaczony jako Q₂, jest również znany jako mediana. Dzieli zestaw danych na dwie równe części, z 50% wartości leżących poniżej i 50% powyżej.

Trzeci kwartyl, oznaczony jako Q₃, to wartość, poniżej której spada 75% danych, z pozostałymi 25% leżącymi powyżej.

Obliczanie kwartyli

Procedura obliczania kwartyli dla zestawu danych:

  1. Uporządkuj dane w kolejności rosnącej.

  2. Aby obliczyć drugi kwartyl, oblicz medianę. Dla pierwszego i trzeciego kwartyla, postępuj jak następuje. Określ n - liczbę wartości w zestawie danych.

  3. Dla pierwszego kwartyla oblicz L = 0,25n. Dla trzeciego kwartyla oblicz L = 0,75n.

  4. Jeśli L jest liczbą całkowitą, kwartyl jest średnią wartością na pozycji L i wartością na pozycji L + 1.

  5. Jeśli L nie jest liczbą całkowitą, zaokrąglij do najbliższej wyższej liczby całkowitej. Kwartyl to wartość na pozycji odpowiadającej zaokrąglonej wartości.

Przykład obliczenia kwartyli

Dla danego zestawu dwudziestu wartości,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

możemy obliczyć kwartyle następująco:

  1. Uporządkuj zestaw danych rosnąco lub malejąco. Tutaj, kolejność prezentuje się tak:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

  1. Z wcześniejszych obliczeń już wiemy, że

Mediana = 70

  1. L dla pierwszego kwartyla: 0,25 × 20 = 5. L dla trzeciego kwartyla: 0,75 × 20 = 15.

  2. 5 jest liczbą całkowitą, więc Q₁ w naszym przypadku to:

$$Q₁=\frac{55+59}{2}=57$$

  1. 15 jest także liczbą całkowitą, więc Q₃, w naszym przypadku to

$$Q₃=\frac{72+75}{2}=73,5$$

Zatem dla tego zestawu danych, pierwszy kwartyl wynosi 57, drugi to 70, a trzeci to 73,5.

Kalkulator rozstępu międzykwartylowego

Rozstęp międzykwartylowy (IQR) to różnica między trzecim kwartylem Q₃ a pierwszym kwartylem Q₁ zestawu danych. Jest to miara przeciętnego rozproszenia, którą można obliczyć w następujący sposób:

IQR = Q₃ - Q₁

Przykład obliczenia IQR

W poprzedniej sekcji już obliczyliśmy pierwszy i trzeci kwartyl. Wynoszą one odpowiednio 57 i 73,5. Teraz wystarczy zastosować formułę.

IQR = Q₃ - Q₁ = 73,5 - 57 = 16,5

Zatem dla tego zestawu danych, rozstęp międzykwartylowy wynosi 16,5.

Wyniki

W naszym przypadku, Luigi przeprowadzając mini-analizę cen pizzy Margherita, może dojść do następujących wniosków: Średnia i mediana nie pokrywają się; występuje lekkie skrzywienie danych. Jednak nie jest ono bardzo zauważalne. Dlatego zarówno średnia, jak i mediana mogą być użyte do pomiaru tendencji centralnej.

Jeśli Luigi chciałby ustalić przeciętną cenę pizzy Margherita, mógłby wziąć pod uwagę zarówno średnią, jak i medianę. Jednak ceny takie jak 71.900 IDR czy 69.500 IDR mogą nie być zbyt zapadające w pamięć. Na szczęście modalna cena pizzy Margherita mieści się w tym zakresie, na poziomie 70.000 IDR, co czyni ją dogodną wartością dla Luigi do wykorzystania w strategii cenowej.

Jeśli chciałby stworzyć pizzerię dla bardziej oszczędnej grupy docelowej, mógłby skupić się na kwotach zbliżonych do pierwszego kwartyla. Czyli ceny około 57.000 rupii indonezyjskich. Nie jest to bardzo wygodne, aby skupiać się na trzecim kwartyle do ustalania ceny dla bardziej wymagających klientów, ponieważ trzeci kwartyl nie jest bardzo reprezentatywny.