Statistische Rechner
Rechner für Standardabweichung und Fehlermarge


Rechner für Standardabweichung und Fehlermarge

Bei einem diskreten Datensatz berechnet der Rechner den Mittelwert, die Varianz und die Standardabweichung einer Stichprobe oder einer Grundgesamtheit und zeigt alle Zwischenschritte der Berechnungen an.

Stichprobe Population
Standardabweichung σ = 5.3385 s = 4.9937
Varianz σ2 = 28.5 s2 = 24.9375
Anzahl n = 8 n = 8
Mittelwert μ = 18.25 x̄ = 18.25
Quadratsumme SS = 199.5 SS = 199.5

Es gab einen Fehler bei Ihrer Berechnung.

Inhaltsverzeichnis

  1. Die Standardabweichung
  2. Die Standardabweichung der Bevölkerung
    1. Beispiel für die Berechnung der Standardabweichung der Grundgesamtheit
  3. Die Standardabweichung der Stichprobe
  4. Fehlermarge
  5. Das Konfidenzintervall
    1. Beispiel für die Berechnung eines Konfidenzintervalls

Rechner für Standardabweichung und Fehlermarge

Der Rechner für die Standardabweichung berechnet die Standardabweichung einer Reihe von Zahlen. Darüber hinaus liefert er zusätzliche Informationen über die Zahlen, einschließlich des Mittelwerts und der Varianz. Der Rechner berechnet auch das Konfidenzintervall des Datensatzes für verschiedene Konfidenzniveaus und liefert die Häufigkeitsverteilungstabelle.

Um diesen Rechner zu verwenden, geben Sie die Zahlen durch Kommata getrennt in den Rechner ein. Wählen Sie aus, ob die Zahlen eine Grundgesamtheit oder eine Stichprobe darstellen, und klicken Sie auf "Berechnen". Über die Schaltfläche "Löschen" können Sie den Rechner auch löschen, um einen anderen Satz von Zahlen einzugeben.

Die Standardabweichung

Die Standardabweichung ist ein statistisches Maß, das den Grad der Streuung oder Variabilität eines bestimmten Datensatzes definiert. Sie gibt den aggregierten durchschnittlichen Abstand der Datenpunkte vom Mittelwert des Datensatzes an. Je kleiner die Standardabweichung ist, desto näher liegen die Datenpunkte am Mittelwert. Umgekehrt gilt: Je höher die Standardabweichung, desto weiter sind die Datenpunkte vom Mittelwert entfernt. Die Standardabweichung ist die Quadratwurzel aus einem anderen Maß für die Streuung, der Varianz.

Die Standardabweichung wird auf der Grundlage der Informationen über den Datensatz berechnet. Wenn der Datensatz alle Datenpunkte von Interesse (Grundgesamtheit) repräsentiert, wird die Standardabweichung als Populationsstandardabweichung bezeichnet. Wenn der Datensatz jedoch eine Stichprobe aus einer Grundgesamtheit darstellt, wird die Standardabweichung als Stichprobenstandardabweichung bezeichnet.

Die Standardabweichung der Bevölkerung

Die Standardabweichung der Grundgesamtheit wird berechnet, wenn der Datensatz die Grundgesamtheit von Interesse repräsentiert. Das heißt, der Datensatz repräsentiert alle betrachteten Beobachtungen. Die Populationsstandardabweichung wird mit σ bezeichnet.

σ ist der Kleinbuchstabe eines griechischen Buchstabens namens Sigma. Die Standardabweichung der Grundgesamtheit wird mit der folgenden Formel berechnet:

$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

Wo:

  • Σ ist der griechische Großbuchstabe Sigma, der in der Mathematik zur Bezeichnung der Summation verwendet wird;
  • xᵢ steht für jeden der Datenpunkte (jede Beobachtung des Datensatzes), beginnend mit dem ersten Datenpunkt bis zum N-ten (letzten) Datenpunkt;
  • μ stellt den Mittelwert der Bevölkerung dar;
  • n ist die Größe der Bevölkerung.

Beispiel für die Berechnung der Standardabweichung der Grundgesamtheit

Das folgende Beispiel zeigt, wie man die Standardabweichung von Bevölkerungsdaten ermittelt.

Anleger betrachten Aktien aufgrund ihrer im Vergleich zu anderen Vermögensklassen hohen Volatilität als riskante Anlage. Ein Anlageverwalter möchte die Volatilität einiger Aktien im vergangenen Monat analysieren und wird seinen Kunden keine Aktie empfehlen, deren Standardabweichung größer oder gleich dem Mittelwert ist, da er eine solche Aktie für "zu riskant" hält.

Nachfolgend sind alle Tagesschlusskurse (in USD) der Aktien des Vormonats aufgelistet. Berechnen Sie die Standardabweichung und bestimmen Sie, ob der Manager die Aktie für "zu riskant" hält:

1,31, 1,30, 1,36, 1,40, 1,40, 1,41, 1,27, 1,19, 1,15, 1,12, 0,99, 1,00, 0,97, 0,94, 0,88, 0,90, 0,86, 0,88, 0,80, 0,81

Es ist zu beachten, dass der Manager nur an den Aktienkursen des Vormonats interessiert ist, und die oben aufgeführten Kurse sind alle Kurse des Vormonats. Wir haben also die Grundgesamtheit zur Verfügung. Wir berechnen also die Standardabweichung anhand der Formel für die Standardabweichung der Grundgesamtheit.

Um die Standardabweichung zu ermitteln, berechnet man zunächst den Mittelwert. Erinnern Sie sich daran, dass der Mittelwert μ erhalten wird, indem man die Summe der Zahlen durch die Anzahl der Zahlen dividiert.

$$\mu=\frac{1,31+1,30+1,36+1,40+1,40+1,41+1,27+1,19+1,15+1,12+0,99+1,00+0,97+0,94+0,88+0,90+0,86+0,88+0,80+0,81}{20}=1,097$$

Ziehen Sie dann von jeder Zahl den Mittelwert ab und quadrieren Sie die Differenz. Dann addiert man die Ergebnisse und teilt das Ergebnis durch die Anzahl. Das Ergebnis wird als Varianz σ² bezeichnet.

$$\sigma^2=\frac{\left(1,31-1,097\right)^2+\left(1,30-1,097\right)^2+\left(1,36-1,097\right)^2+\left(1,40-1,097\right)^2+\ldots+\left(0,81-1,097\right)^2}{20}=0,045031$$

Schließlich wird die Quadratwurzel aus der Varianz gezogen, um die Standardabweichung zu erhalten.

$$\sigma=\sqrt{0,045031}\approx0,21$$

Wie Sie sehen können, ist die Standardabweichung der Kurse dieser Aktie im letzten Monat geringer als der Mittelwert. Daher wird der Manager diese Aktie nicht als "zu riskant" betrachten.

Die Standardabweichung der Stichprobe

Die Stichprobenstandardabweichung wird berechnet, wenn der betrachtete Datensatz eine Stichprobe aus der interessierenden Grundgesamtheit darstellt. Der Datensatz stellt eine kleinere Menge von Beobachtungen aus der Gesamtheit der betrachteten Beobachtungen dar. Die Stichprobenstandardabweichung wird mit s bezeichnet. Die Stichprobenstandardabweichung wird nach folgender Formel berechnet:

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

Wo:

  • Σ bezeichnet die Summierung;
  • xᵢ steht für jeden der Datenpunkte;
  • stellt den Stichprobenmittelwert dar;
  • n ist der Stichprobenumfang.

Wie die Standardabweichung von Stichprobendaten zu ermitteln ist, wird anhand des gleichen Beispiels wie für die Standardabweichung der Grundgesamtheit veranschaulicht. In dieser Situation hat der Anlageverwalter jedoch keinen Zugang zu den Schlusskursen aller Handelstage des Vormonats. Er verfügt jedoch über die Schlusskurse einiger zufälliger 5 Tage des Vormonats. Folglich schätzt er die Standardabweichung der Aktienschlusskurse anhand der Daten aus der verfügbaren Stichprobe.

Nehmen wir an, dass er die Schlusskurse für 5 Tage hat:

1,31, 1,40, 0,86, 0,88, 1,40

Man beachte, dass der Manager an den Aktienkursen des Vormonats interessiert ist. Ihm liegen jedoch nicht alle Kurse des Vormonats vor, sondern eine kleine Teilmenge der Schlusskurse von nur 5 Tagen. In diesem Fall haben wir es also mit einer Stichprobe zu tun. Wir berechnen die Standardabweichung mit Hilfe der Formel für die Standardabweichung der Stichprobe.

Berechnen Sie zunächst den Mittelwert der Stichprobe.

$$\bar{x}=\frac{1,31+1,40+0,86+0,88+1,40}{5}=1,17$$

Berechnen Sie anschließend die Varianz .

$$s^2=\frac{\left(1,31-1,17\right)^2+\left(1,40-1,17\right)^2+\left(0,86-1,17\right)^2+\left(0,88-1,17\right)^2+\left(1,40-1,17\right)^2}{5-1}=0,0764$$

Schließlich wird die Quadratwurzel aus der Varianz gezogen, um die Standardabweichung zu erhalten.

$$s=\sqrt{0,0764}\approx 0,28$$

Fehlermarge

Die Standardabweichung wird unter anderem dazu verwendet, den "akzeptablen" Wertebereich zu berechnen. Dies spielt eine wichtige Rolle bei der statistischen Qualitätssicherung in der Industrie und bei prädiktiven Analysen. Angenommen, die zugrundeliegenden Daten folgen einer Normalverteilung. In diesem Fall wird dieser Bereich als Konfidenzintervall bezeichnet (siehe den nächsten Abschnitt). Diese Konfidenzintervalle werden mit verschiedenen Konfidenzniveaus (oder Prozentsätzen) angegeben.

Die Fehlermarge ist eine Komponente des Konfidenzintervalls, die die Breite des Konfidenzintervalls angibt. Das heißt, die Fehlermarge gibt das Maximum und das Minimum der akzeptierten Werte der betrachteten Größe an.

Die Fehlermarge wird nach der folgenden Formel berechnet:

$$Irrtumswahrscheinlichkeit = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

Wir wenden diese Formel an, wenn die Standardabweichung der Population, σ, bekannt ist. Gleichzeitig sollte die Stichprobe ausreichend groß sein (normalerweise n>30).

Wenn die Standardabweichung der Grundgesamtheit nicht bekannt ist und die Stichprobe klein ist (normalerweise n≤30), wird die folgende Formel verwendet:

$$Irrtumswahrscheinlichkeit = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

In dieser Formel wird die Stichprobenstandardabweichung s verwendet, da die Populationsstandardabweichung σ nicht bekannt ist.

\$z_{\alpha/2}\$ und \$t_{n-1, \alpha/2}\$ werden mit Hilfe der z-Statistik bzw. t-Statistik bestimmt und als kritischer Wert bezeichnet. Sie sind Konstanten, die mit Konfidenzniveaus verbunden sind.

Die in der Statistik am häufigsten verwendeten Konfidenzintervalle sind 90%, 95% und 99%. Und ihre \$z_{\alpha/2}\$-Werte sind 1,645 (für 90%), 1,96 (für 95%) und 2,575 (für 99%)

\$\frac{\sigma}{\sqrt n}\$ oder \$\frac{s}{\sqrt n}\$ werden als Standardfehler bezeichnet.

  • \$\frac{\sigma}{\sqrt n}\$ wird verwendet, wenn die Standardabweichung der Grundgesamtheit σ bekannt ist und wir eine große Stichprobe haben (normalerweise n>30).
  • \$\frac{s}{\sqrt n}\$ wird für Fälle verwendet, in denen die Standardabweichung der Grundgesamtheit nicht bekannt ist und wir eine kleine Stichprobe (normalerweise n≤30) haben. Das heißt, anstelle der Standardabweichung der Grundgesamtheit σ müssen wir die Standardabweichung der uns zur Verfügung stehenden Stichprobe s verwenden.

Das Konfidenzintervall

Wie oben eingeführt, ist das Konfidenzintervall ein Intervall (Wertebereich), in dem eine bestimmte Größe mit einem bestimmten Konfidenzniveau liegen dürfte.

Wir können zum Beispiel sagen, dass ein bestimmter Wert, z. B. die Körpergröße von 13-jährigen Mädchen, mit einer Wahrscheinlichkeit von 90 % zwischen 59 und 66 Zoll liegt. Das heißt, wenn wir eine Gruppe von 13-jährigen Mädchen auswählen, liegt ihre Körpergröße in etwa 90 % der Fälle zwischen den angegebenen Werten.

Das Konfidenzintervall wird anhand der Formel berechnet:

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

  • ist der Stichprobenmittelwert,
  • \$z_{\alpha/2}\$ ist der kritische Wert,
  • σ ist die Standardabweichung der Bevölkerung,
  • n ist die Anzahl der Beobachtungen.

Eine andere Formel wird verwendet, wenn die Standardabweichung der Grundgesamtheit σ nicht bekannt ist und stattdessen die Standardabweichung der Stichprobe s verwendet werden muss:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • ist der Stichprobenmittelwert,
  • \$t_{n-1,\alpha/2}\$ ist der kritische Wert,
  • s ist die Standardabweichung der Stichprobe,
  • n ist die Anzahl der Beobachtungen.

Wie wir uns aus dem vorigen Kapitel erinnern können, sind \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ und \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ die Fehlermargen.

Beispiel für die Berechnung eines Konfidenzintervalls

Angenommen, wir wissen, dass die täglichen Aktienkurse, die wir betrachten, normalverteilt sind. Wir haben eine Stichprobe von Aktienkursen zur Verfügung:

1,31, 1,36, 1,40, 1,27, 1,15, 0,99, 0,97, 0,88, 0,86, 0,80

Wir müssen berechnen, in welchem Bereich die Aktienkurse mit einer Wahrscheinlichkeit von 95 % schwanken werden.

Da es sich um eine kleine Stichprobe handelt und wir die Standardabweichung der Grundgesamtheit nicht kennen, werden wir die Standardabweichung der Stichprobe und die Formel zur Berechnung verwenden:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • ist der Stichprobenmittelwert, 1,10
  • \$t_{n-1,\alpha/2}\$ ist der kritische Wert, \$t_{9, 0,025}\$ = 2,26 (der kritische Wert für eine bestimmte Stichprobengröße und ein bestimmtes Konfidenzniveau wird in der Regel anhand einer z-Tabelle oder t-Tabelle berechnet)
  • s ist die Standardabweichung der Stichprobe, 0,23
  • n ist die Anzahl der Beobachtungen, 10,
  • \$\frac{s}{\sqrt n}\$ ist der Standardfehler \$\frac{0,23}{\sqrt{10}}=0,07\$

Also setzen wir die Zahlen in die Formel ein

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

und wir erhalten:

$$1,10 - 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 - 2,26 (\frac{0,23}{3,16}) = 1,10 - 2,26 × 0,07 = 1,10 - 0,16 = 0,94$$

$$1,10 + 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 + 2,26 (\frac{0,23}{3,16}) = 1,10 + 2,26 × 0,07 = 1,10 + 0,16 = 1,26$$

Das bedeutet, dass wir zu 95% sicher sind, dass der durchschnittliche Aktienkurs im Konfidenzintervall (0,94, 1,26) liegt.