Keine Ergebnisse gefunden
Wir können derzeit nichts mit diesem Begriff finden, versuchen Sie, etwas anderes zu suchen.
Rechner für Mittelwert, Median und Modus in der Statistik. Verwenden Sie diesen Rechner, um den Mittelwert, Median, Modus, Bereich und den Durchschnitt für jeden Datensatz zu ermitteln.
Ergebnis | |||
---|---|---|---|
Mittelwert x̄ | 16.75 | Ausreißer | 6, 33, 35 |
Median x̃ | 15 | Quartil Q1 | 12.5 |
Modus | 15 erschien 3 mal | Quartil Q2 | 15 |
Bereich | 29 | Quartil Q3 | 16 |
Minimum | 6 | Interquartilsabstand IQR | 3.5 |
Maximum | 35 | ||
Summe | 201 | ||
Anzahl n | 12 |
Es gab einen Fehler bei Ihrer Berechnung.
Die Interpretation von Tabellen und Diagrammen mit statistischen Daten kann für uns schwierig sein. Oft müssen wir Datensätze zusammenfassen und wichtige Merkmale identifizieren, um mehr nützliche Informationen aus Statistiken zu erhalten.
In der Statistik werden verschiedene Maße verwendet, um Daten zusammenzufassen. Einige beschreiben das Zentrum der Daten; sie werden Maße der zentralen Tendenz genannt. Andere sagen aus, wie weit die Datenwerte gestreut sind; sie werden Streuungsmaße genannt. Andere, so genannte Positionsmaße, zeigen den Anteil der Daten auf, der unter einem bestimmten Wert liegt.
Der Hauptzweck dieses Rechners ist die Berechnung der Maße der zentralen Tendenz - Mittelwert und Median -, die den typischen oder zentralen Wert in einem Datensatz darstellen können. Der sekundäre Zweck dieses Rechners besteht darin, den Grad der Variation in einem Datensatz zu bestimmen, indem der Bereich, die Quartile und der Interquartilsbereich berechnet werden.
Der Mittelwert ist die Summe der Werte geteilt durch die Gesamtzahl der Werte. Er ist am einfachsten zu verstehen und zu berechnen, wenn man die folgende Formel zur Berechnung des Mittelwerts für eine Stichprobe verwendet:
$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$
Die Formel für den Mittelwert der Grundgesamtheit lautet:
$$\mu=\frac{x₁+x₂+x₃+\ldots+x_n}{N}=\frac{\sum_{}^{}x}{N}$$
Dabei steht der Zähler für die Summe der Werte im Datensatz. Und der Nenner steht für die Anzahl der Werte im Datensatz.
Das Hauptmerkmal der Verwendung des arithmetischen Mittels ist, dass es alle im Datensatz vorhandenen Datenpunkte umfasst.
Die größte Einschränkung des Mittelwerts besteht darin, dass er anfällig für extreme Werte ist, die entweder zu groß oder zu klein sind. Solche Werte werden als Ausreißer bezeichnet und beeinträchtigen den Durchschnitt erheblich.
Beachten Sie auch, dass der Durchschnittswert nicht unbedingt der typische Wert für die Daten ist. Der Mittelwert kann ein Wert sein, der in dem Datensatz überhaupt nicht vorkommt.
Die Grundgesamtheit besteht aus der gesamten Menge der Werte, über die man Informationen erhält. Die Stichprobe besteht aus einer kleineren Gruppe, die der Grundgesamtheit entnommen wird.
Die Methode zur Berechnung des Mittelwerts ist für Stichproben und Grundgesamtheiten die gleiche. Nur die Bezeichnungen unterscheiden sich.
Wenn x₁, x₂,..., xₙ eine Stichprobe ist, wird der Mittelwert als Stichprobenmittelwert bezeichnet und durch das Symbol x̄ dargestellt. Der Mittelwert der Grundgesamtheit wird mit dem griechischen Buchstaben 𝜇 bezeichnet.
In der Statistik wird der Kleinbuchstabe n für den Stichprobenumfang und der Großbuchstabe N für den Umfang der Grundgesamtheit verwendet.
Betrachten wir das folgende Beispiel: Luigi ist ein erstklassiger Koch und Pizzaliebhaber. Er hat beschlossen, seine Pizzeria auf Bali zu eröffnen. Um einen Investor zu finden, schreibt Luigi einen Geschäftsplan. Er möchte die durchschnittlichen Kosten für Pizza in verschiedenen Restaurants auf der Insel ermitteln, um die zukünftige finanzielle Leistungsfähigkeit zu bewerten.
Er recherchierte ein wenig über den Preis der Pizza Margherita in Restaurants auf Bali und erhielt einen Datensatz mit Pizzapreisen. Um die Berechnung zu vereinfachen, lassen wir die letzten drei Nullen weg und verwenden die Tausenderzahl des Preises. Das heißt, dass 60 in unseren Berechnungen 60.000 indonesische Rupiahs bedeutet.
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Luigi hat nicht jede Pizzeria auf der Insel besucht. Er hat 20 von ihnen zufällig ausgewählt. Wir haben es also mit einer Stichprobe zu tun.
Berechnen wir den Durchschnittswert für diesen Datensatz mit Hilfe der Formel:
$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$
Das Ergebnis ist der Mittelwert x̄ = 71,9.
Luigis Nachforschungen haben ergeben, dass der Durchschnittspreis für eine Pizza Margherita auf Bali 71.900 indonesische Rupiah beträgt. Er kann nun seine Berechnungen auf diesen Preis stützen.
Der Median ist ein Positionsmaß, das den Durchschnittswert eines auf- oder absteigend angeordneten Datensatzes darstellt.
Bei der Berechnung des Medians wird versucht, eine Zahl zu finden, die den Datensatz in zwei Hälften teilt. Die Hälfte der Datenwerte ist kleiner als der Median, die andere Hälfte ist größer als der Median. Deshalb müssen wir bei der manuellen Bestimmung des Medians ohne einen Medianrechner die Werte in aufsteigender oder absteigender Reihenfolge sortieren.
Die Berechnung des Medians unterscheidet sich je nachdem, ob die Anzahl der Werte im Datensatz gerade oder ungerade ist.
Wenn die Gesamtzahl der Elemente ungerade ist, d. h. n oder N ungerade ist, gilt die folgende Formel:
$$Median=(\frac{n+1}{2})-te -Element$$
Ist die Anzahl der Elemente jedoch gerade, d. h. n ist eine gerade Zahl, dann wird die folgende Formel verwendet:
$$Median=\frac{\left[(\frac{n}{2})-te \ Element+(\frac{n}{2}+1)-te \ Element\right]}{2}$$
Der Hauptvorteil der Verwendung des Medians besteht darin, dass er am wenigsten von extrem hohen oder extrem niedrigen Werten beeinflusst wird.
Für eine bestimmte Menge von zwanzig Werten,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Wir können den Median wie folgt berechnen:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Bestimmen wir die Anzahl der Werte im Datensatz. Wir haben n = 20.
Wenn n ungerade ist, wählen wir den zentralen Wert der Daten als Median. Wenn n gerade ist, ermitteln wir das arithmetische Mittel der beiden Medianwerte. Addiere sie und teile die Summe durch 2.
20 ist eine gerade Zahl.
Die zentralen Werte in unserer Stichprobe sind 69 und 70. Auf diese Weise finden wir den Median:
$$Median = \frac{69 + 70}{2} = 69,5$$
Wenn Luigi einen Satz von 21 Werten hätte, z. B.,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 90, 55, 72, 70
Er könnte die Werte bestellen:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 90, 95, 120, 160
und wählen Sie den Wert in der Mitte an der 11. Stelle, also 70.
Sowohl der Mittelwert als auch der Median werden als Maß für die zentrale Tendenz verwendet. Es ist jedoch wichtig zu wissen, wie sie sich unterscheiden.
Ein wesentlicher Unterschied zwischen dem Mittelwert und dem Median besteht darin, dass die Formel für den Mittelwert alle Werte des Datensatzes verwendet. Im Gegensatz dazu hängt die Formel für den Median nur von der zentralen Zahl oder zwei der zentralen Zahlen ab.
Dies ist besonders wichtig für Datensätze, bei denen eine oder mehrere Zahlen ungewöhnlich groß oder ungewöhnlich klein sind. Solche Zahlen werden als Ausreißer bezeichnet. In den meisten Fällen haben diese Ausreißer erhebliche Auswirkungen auf den Mittelwert, aber nur geringe oder keine Auswirkungen auf den Median.
In der Statistik sagt man, dass ein Maß resistent ist, wenn sein Wert nicht stark von Extremwerten im Datensatz beeinflusst wird. Wir können also sagen, dass der Median resistent ist und der Mittelwert nicht resistent ist.
Der Mittelwert und der Median messen die Mitte des Datensatzes auf unterschiedliche Weise. Der Mittelwert ist der Punkt, an dem sich der Datensatz ausgleicht. Der Median ist der Durchschnitt, der 50% der Daten auf der einen Seite von 50% der Daten auf der anderen Seite trennt. Wenn der Datensatz symmetrisch ist, sind Mittelwert und Median gleich.
Aber der Mittelwert und der Median sind möglicherweise nicht gleich.
In einigen Datensätzen kann der Mittelwert kleiner als der Median sein, oder der Median kann kleiner als der Mittelwert sein. In diesem Fall sagen wir, dass der Datensatz schief ist.
Liegt der Mittelwert links oder kleiner als der Median, so ist der Datensatz linksschief. Liegt der Mittelwert rechts oder größer als der Median, so ist der Datensatz rechtsschief.
Weder der Mittelwert noch der Median sind als Maß für die zentrale Tendenz besser geeignet. Beide messen die Mitte auf unterschiedliche Weise. Einige Experten ziehen es vor, den Median zu verwenden, wenn die Daten stark schief sind oder Extremwerte enthalten, weil der Median einen typischen Wert besser repräsentiert.
Ein Modus ist der Wert eines Datensatzes, der am häufigsten in dem Datensatz vorkommt. Das ist der Wert, der am häufigsten vorkommt.
Ein Datensatz mit nur einem Wert, der am häufigsten vorkommt, wird als unimodal bezeichnet.
Wenn ein Datensatz zwei Werte mit der gleichen höchsten Häufigkeit aufweist, werden beide Werte als modal betrachtet, und der Datensatz wird als bimodal bezeichnet.
Wenn ein Datensatz mehr als zwei Werte mit der gleichen höchsten Häufigkeit aufweist, wird jeder Wert als Modus verwendet, und der Datensatz wird als multimodal betrachtet.
Wenn kein einziger Datenwert mehr als einmal vorkommt, wird gesagt, dass der Datensatz keinen Modus hat. In diesem Fall wäre es falsch zu sagen, dass der Modus Null ist. In einigen Datensätzen, z. B. bei Temperaturmessungen, kann der Wert Null tatsächlich der tatsächliche Wert sein.
Der Hauptvorteil der Berechnung eines Modus ist, dass er am einfachsten zu finden ist und nicht durch Extremwerte beeinflusst wird. Der Nachteil der Modusberechnung besteht darin, dass es in bestimmten Situationen für einige Datensätze möglicherweise keinen Moduswert gibt.
Für eine bestimmte Gruppe von zwanzig Werten,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Wir können den Modus wie folgt finden:
Ordnen Sie den Datensatz in aufsteigender oder absteigender Reihenfolge an. Hier ist die Reihenfolge wie folgt:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Als nächstes wird der Wert ermittelt, der am häufigsten wiederholt wird. Hier ist der häufigste Wert 70. Für einen gegebenen Datensatz ist der Modalwert also 70.
Der Modus wird auch als Maß für die zentrale Tendenz bezeichnet. Dies ist jedoch nicht ganz zutreffend. Der Modus kann der größte Wert im Datensatz, der kleinste Wert oder ein beliebiger anderer Wert sein. Zum Beispiel, wenn wir die folgenden Zahlen im Datensatz haben:
42, 45, 50, 53, 55, 57, 59, 60, 63, 69, 70, 72, 79, 82, 83, 95, 96, 120, 120, 120
Der Modus wäre 120. Allerdings würde er in diesem Fall nicht die zentrale Tendenz widerspiegeln.
Interessanterweise können wir nur den Mittelwert und den Median für quantitative Daten berechnen. Und wir können den Modus sowohl für quantitative als auch für qualitative Daten berechnen.
Anna zum Beispiel isst im Durchschnitt 12 Mal pro Monat Pizza.
In diesem Fall haben wir zwei Varianten: Pizza Napoletana und Pizza Margherita.
Um die Variabilität in einem Datensatz zu bestimmen, verwenden wir Varianzmaße. Sie spiegeln in der Regel den Grad der Abweichung der Daten vom Zentralwert wider. Wir können die Varianz in einem Datensatz anhand des Bereichs, der Quartile und des Interquartilsbereichs untersuchen.
Der Bereich für einen Datensatz ist die Differenz zwischen dem höchsten und dem niedrigsten Wert des Datensatzes. Er lässt sich berechnen, indem man die Höchst- und Mindestwerte des Datensatzes bestimmt. Die Formel zur Berechnung der Spanne lautet:
$$Bereich = Größter\ Wert - Kleinster\ Wert$$
Für eine bestimmte Menge von zwanzig Werten,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
können wir den Bereich wie folgt berechnen:
Ordnen Sie den Datensatz in aufsteigender oder absteigender Reihenfolge an. Hier sieht die Reihenfolge wie folgt aus:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Außerdem ist der höchste Wert 160 und der niedrigste Wert 42. Daraus ergibt sich der Bereich:
$$Bereich = Größter\ Wert - Kleinster\ Wert = 160 - 42 = 118$$
Daher beträgt die Spanne für diesen Datensatz 118.
Quartile sind Werte, die den Datensatz durch drei Punkte in vier Quartile unterteilen, nämlich in das erste, zweite und dritte Quartil.
Das erste Quartil, bezeichnet mit Q₁, stellt den Punkt dar, der die ersten 25 % der Werte im Datensatz repräsentiert, die kleiner als dieser Wert sind. Die anderen 75 % der Werte sind größer.
Das zweite Quartil, das mit Q₂ bezeichnet ist, ist der Median. Das bedeutet, dass 50 % des Datensatzes kleiner als dieser Wert und die anderen 50 % größer als Q₂ sind.
Das dritte Quartil, bezeichnet mit Q₃, ist der Punkt, der 75 % der Werte repräsentiert, die unter diesem Wert liegen, während die restlichen 25 % darüber liegen.
Ein Verfahren zur Berechnung der Quartile eines Datensatzes:
Ordnen Sie die Daten in aufsteigender Reihenfolge an.
Um das zweite Quartil zu berechnen, ist der Median zu ermitteln. Für das erste und dritte Quartil ist wie folgt vorzugehen. Bestimmen Sie n - die Anzahl der Werte im Datensatz.
Für das erste Quartil berechnen Sie L = 0,25n. Für das dritte Quartil berechnen Sie L = 0,75n.
Wenn L eine ganze Zahl ist, ist das Quartil der Durchschnitt aus der Zahl an Position L und der Zahl an Position L + 1.
Wenn L keine ganze Zahl ist, wird auf die nächsthöhere ganze Zahl aufgerundet. Das Quartil ist die Zahl an der Stelle, die dem gerundeten Wert entspricht.
Für eine bestimmte Gruppe von zwanzig Werten,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Wir können die Quartile wie folgt berechnen:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Median = 70
L für das erste Quartil: 0,25 × 20 = 5. L für das dritte Quartil: 0,75 × 20 = 15.
5 ist eine ganze Zahl, also ist Q₁ in unserem Fall:
$$Q₁=\frac{55+59}{2}=57$$
$$Q₃=\frac{72+75}{2}=73,5$$
Für diesen Datensatz liegt das erste Quartil bei 57, das zweite bei 70 und das dritte bei 73,5.
Der Interquartilsbereich (IQR) ist die Differenz zwischen dem dritten Q₃ und dem ersten Q₁ Quartil eines Datensatzes. Er ist ein Maß für die durchschnittliche Streuung, das wie folgt berechnet werden kann:
IQR = Q₃ - Q₁
Im vorangegangenen Abschnitt haben wir bereits das erste und dritte Quartil berechnet. Sie lauten 57 und 73,5. Alles, was wir tun müssen, ist, die Formel anzuwenden.
IQR = Q₃ - Q₁ = 73,5 - 57 = 16,5
Für diesen Datensatz beträgt der Interquartilsbereich also 16,5.
In unserem Fall, bei Luigis Mini-Umfrage zu den Preisen der Margherita-Pizza, konnte er folgende Schlussfolgerungen ziehen: Der Mittelwert und der Median stimmen nicht überein; es hat sich eine leichte Schieflage in den Daten gebildet. Aber sie ist nicht sehr auffällig. Daher können sowohl der Mittelwert als auch der Median zur Messung der zentralen Tendenz verwendet werden.
Wenn Luigi den Durchschnittspreis für eine Pizza Margherita nehmen wollte, hätte er entweder den Durchschnitt oder den Median nehmen sollen. Aber IDR 71.900 oder IDR 69.500 wären als einprägsamer Pizzapreis nicht sehr passend gewesen. Glücklicherweise liegt der Durchschnittspreis für die Margherita-Pizza genau in diesem Bereich, nämlich bei 70.000 indonesischen Rupien. Luigi hätte also genau diesen Preis für seine Berechnungen verwenden können.
Wenn er eine Pizzeria für eine sparsamere Zielgruppe eröffnen wollte, könnte er sich auf Zahlen konzentrieren, die näher am ersten Quartil liegen. Das ist ein Preis von etwa 57.000 indonesischen Rupien. Es ist nicht sehr praktisch, sich auf das dritte Quartil zu konzentrieren, um den Preis für anspruchsvollere Kunden zu bestimmen, da das dritte Quartil nicht sehr repräsentativ ist.