Statistische Rekenmachines
Variantiecalculator


Variantiecalculator

Gegeven een discrete gegevensverzameling die een steekproef of een populatie vertegenwoordigt, berekent de calculator het gemiddelde, de variantie en de standaardafwijking en toont de workflow die bij de berekening betrokken is.

Steekproef Populatie
Variantie σ2 = 28.5 s2 = 24.9375
Standaarddeviatie σ = 5.3385 s = 4.9937
Aantal n = 8 n = 8
Gemiddelde μ = 18.25 x̄ = 18.25
Som van Kwadraten SS = 199.5 SS = 199.5

Er was een fout met uw berekening.

Inhoudsopgave

  1. Variantie als maat voor variabiliteit
  2. De regels voor het gebruik van deze calculator
  3. De formule voor variantie: populatievariantie versus steekproefvariantie
    1. Populatievariantie
    2. Steekproefvariantie
  4. Stappen voor het berekenen van de variantie
  5. Voorbeeld van variantieberekening voor een steekproef
  6. De betekenis van variantie

Variantiecalculator

Variantie als maat voor variabiliteit

Een van de fundamentele aspecten van de statistische inferentie van een gegeven gegevensverzameling is het meten van een maatstaf die de variabiliteit van gegevens van hun gemiddelde karakteriseert. De meest populaire maatstaven die de variabiliteit meten zijn:

  • Variantie is het gemiddelde van de gekwadrateerde afwijkingen van het gemiddelde.
  • Standaardafwijking - is de wortel van de variantie. Standaardafwijking is een veelgebruikte maatstaf om dispersie/variabiliteit te meten.
  • De variatiecoëfficiënt, die ook bekend staat als de relatieve standaardafwijking. De variatiecoëfficiënt wordt berekend als de verhouding van de standaardafwijking σ tot het gemiddelde μ of \$(C_v=\frac{σ}{μ})\$.

Deze calculator vindt de variantie van een gegeven gegevensverzameling en toont de stappen die bij de berekening betrokken zijn.

De regels voor het gebruik van deze calculator

De variantiecalculator accepteert invoer als een lijst van getallen gescheiden door een scheidingsteken. Een paar voorbeelden van mogelijke invoer worden in de onderstaande tabel getoond.

rij-invoer kolominvoer kolominvoer kolominvoer
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

De getallen kunnen gescheiden worden door een komma, een spatie, een regeleinde of een mix van meer dan één type scheidingsteken. U kunt zowel het rij- als het kolomformaat gebruiken. Voor alle in de bovenstaande tabel getoonde formaten verwerkt de calculator de invoer als 44, 63, 72, 75, 80, 86, 87 en 89.

Na het invoeren van de gegevens kunt u selecteren of het om steekproefgegevens of populatiegegevens gaat. Wanneer u op de berekenknop drukt, toont de calculator vijf statistische parameters van de gegevensverzameling: aantal (aantal observaties), gemiddelde, som van de gekwadrateerde afwijkingen, variantie en de standaardafwijking.

De calculator is ontworpen om de variantie van een gegevensverzameling te berekenen. Het biedt ook inzicht in de theorie achter de berekening en toont alle betrokken stappen.

Bij het maken van inferenties is het te verkiezen om een grote gegevensverzameling te gebruiken om goede statistieken te verkrijgen. Maar het is vaak moeilijk om populatiegegevens te verkrijgen die alle mogelijke observaties vertegenwoordigen. Daarom wordt als regel een "steekpro

ef" genomen uit de populatie. En conclusies over de populatie worden meestal getrokken uit de steekproefgegevens.

Variantie meet de gemiddelde dispersie van een gegevensverzameling in relatie tot het gemiddelde. Het wordt vaak aangeduid met σ² voor een populatie en met voor een steekproef. Een grotere waarde van σ² of impliceert een grotere dispersie van gegevenspunten van het steekproefgemiddelde en vice versa.

Overweeg de volgende voorbeeldgegevensverzamelingen.

(Set I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,

(Set II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

Als we Set I invoeren in de variantiecalculator, krijgen we:

n=11

x̄=16

SS=704

s²=70,4

s=8,39

voor een steekproef, en

n=11

μ=16

SS=704

σ²=64

σ=8

voor de populatie.

Op soortgelijke wijze levert het invoeren van Set II in de calculator:

n=11

x̄=16

SS=56

s²=5,6

s=2,36

voor een steekproef, en

n=11

μ=16

SS=56

σ²=5,09

σ=2,25

voor de populatie.

  • In Set I weken de getallen aanzienlijk af van het steekproefgemiddelde

s²=70,4

σ²=64

  • In Set II is de variabiliteit klein

s²=5,6

σ²=5,09

De formule voor variantie: populatievariantie versus steekproefvariantie

Populatievariantie

Populatie in statistieken verwijst naar alle mogelijke observaties in een experiment. Voor N observaties, is de populatievariantie:

$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\mu)}^2}}{N}$$

waarbij

  • σ² de populatievariantie is,
  • Σ staat voor sommatie,
  • xᵢ elke observatie is,
  • μ het populatiegemiddelde is,
  • N het aantal observaties in de populatie is.

Steekproefvariantie

De steekproefvariantie wordt gedefinieerd als

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\bar{x})}^2}}{n-1}$$

waarbij

  • de steekproefvariantie is,
  • Σ staat voor sommatie,
  • xᵢ elke observatie is,
  • het steekproefgemiddelde is,
  • n het aantal observaties in de steekproef is.

Stappen voor het berekenen van de variantie

De volgende stappen zijn betrokken bij het berekenen van de variantie.

Stap 1: Bereken het steekproef/populatiegemiddelde. Dit is de som van alle datapunten gedeeld door het aantal datapunten (n voor een steekproef en N voor de populatie), dus

Steekproefgemiddelde:

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$

Populatiegemiddelde:

$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$

Stap 2: Bereken de afwijkingen door het steekproef/populatiegemiddelde van elk datapunt af te trekken, dus

Steekproefafwijkingen:

$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$

Populatieafwijkingen:

$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$

Stap 3: Bereken de gekwadrateerde afwijkingen voor elk datapunt.

Steekproef gekwadrateerde afwijkingen:

$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$

Populatie gekwadrateerde afwijkingen:

$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$

Stap 4: Bereken de som van de gekwadrateerde afwijkingen.

Som van de steekproef gekwadrateerde afwijkingen:

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$

Som van de populatie gekwadrateerde afwijkingen:

$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$

Stap 5: Deel de som van de gekwadrateerde afwijkingen door \$ n-1 \$ voor een steekproef en \$ N \$ voor de populatie om de variantie te berekenen.

Steekproefvariantie:

$$s^2=\frac{SS}{n-1}$$

Populatievariantie:

$$\sigma^2=\frac{SS}{N}$$

Voorbeeld van variantieberekening voor een steekproef

Laten we de volgende dataset beschouwen: 1, 2, 4, 5, 6, en 12. Om de steekproefvariantie te berekenen, volgen we deze stappen:

Stap 1: Bereken het steekproefgemiddelde (gemiddelde).

$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$

Stap 2: Bereken de afwijkingen van het gemiddelde voor elk datapunt.

x₁-̅x x₂-̅x x₃-̅x x₄-̅x x₅-̅x x₆-̅x
1 - 5 2 - 5 4 - 5 5 - 5 6 - 5 12 - 5
-4 -3 -1 0 1 7

Stap 3: Bereken de kwadraten van de afwijkingen.

(x₁-̅x)² (x₂-̅x)² (x₃-̅x)² (x₄-̅x)² (x₅-̅x)² (x₆-̅x)²
16 9 1 0 1 49

Stap 4: Tel de gekwadrateerde afwijkingen bij elkaar op.

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2=16+9+1+0+1+49=76$$

Stap 5: Bereken de steekproefvariantie door de som van de gekwadrateerde afwijkingen te delen door de vrijheidsgraden (n-1).

$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15,2$$

Voor een populatie zouden we delen door n (het totale aantal datapunten), in plaats van n-1, om de populatievariantie te berekenen.

De betekenis van variantie

Dispersie wordt gebruikt bij het beleggen. Het helpt vermogensbeheerders om de prestaties van hun beleggingen te verbeteren. Financiële analisten kunnen variantie gebruiken om de individuele prestaties van componenten van een beleggingsportefeuille te beoordelen.

Beleggers berekenen variantie wanneer ze overwegen een nieuwe aankoop te doen om te beslissen of de investering het risico waard is. Dispersie helpt analisten een maat voor onzekerheid te bepalen, wat zonder variantie en standaardafwijking moeilijk te kwantificeren is.

Onzekerheid is niet direct meetbaar. Maar de variantie en standaardafwijking (de vierkantswortel van de variantie) helpen bij het bepalen van de waargenomen impact van een bepaald aandeel op een portefeuille.

Wetenschappers, statistici, wiskundigen en data-analisten kunnen ook gebruik maken van variantie. Het helpt nuttige informatie te verschaffen over een experiment of steekproefpopulatie.

Wetenschappers kunnen kijken naar verschillen tussen testgroepen om te bepalen of ze genoeg op elkaar lijken om succesvol een hypothese te testen. Hoe hoger de variantie van de dataset, hoe meer verspreid de waarden in de dataset. Data-onderzoekers kunnen deze informatie gebruiken om te zien hoe goed het gemiddelde de dataset vertegenwoordigt.

Het nadeel van het gebruik van variantie is dat grote uitschieters in een set kunnen leiden tot enige vervorming van de gegevens. Dit komt doordat de uitschieters hun gewicht nog verder kunnen verhogen zodra ze gekwadrateerd worden.

Veel onderzoekers geven de voorkeur aan het werken met de standaardafwijking, berekend als de vierkantswortel van de variantie. De standaardafwijking wordt minder beïnvloed door uitschieters, is een kleiner getal en is gemakkelijker te interpreteren.