分散計算機

サンプルまたは母集団を表す離散データセットを指定すると、計算機は平均、分散、および標準偏差を計算し、計算に関連するワークフローを表示します。

データセット

カンマ区切りの数字

	サンプル	母集団
分散	σ2 = 28.5	s2 = 24.9375
標準偏差	σ = 5.3385	s = 4.9937
カウント	n = 8	n = 8
平均	μ = 18.25	x̄ = 18.25
平方和	SS = 199.5	SS = 199.5

変動性測度としての分散

特定のデータセットの統計的推論の基本的な側面の1つは、平均からのデータの変動性を特徴付けるメトリックを測定することです。変動性を測定する最も一般的なメトリックは次のとおりです:

-分散は、平均からの偏差の二乗の平均です。 -標準偏差-は分散の平方根です。標準偏差は、分散/変動性を測定するために一般的に使用されるメトリックです。 -変動係数は、相対標準偏差とも呼ばれます。変動係数は、平均μに対する標準偏差σの比または \$(C_v=\frac{σ}{μ})\$ として計算されます。

この計算機は、特定のデータセットの分散を検出し、計算に関連するステップを表示します。

この計算機を使用するためのルール

分散計算機は、区切り文字で区切られた数値のリストとして入力を受け入れます。可能な入力の例をいくつか次の表に示します。

行入力	列入力	列入力	列入力
44, 63, 72, 75, 80, 86, 87, 89	44	44,	44,63,72
44 63 72 75 80 86 87 89	63	63,	75,80
44,, 63,, 72, 75, 80, 86, 87, 89	72	72,	86,87
44 63 72 75, 80, 86, 87, 89	75	75,	89
44; 63; 72, 75,, 80, 86, 87, 89	80	80,
44,,, 63,, 72, 75, 80, 86, 87, 89	86	86,
44 63,, 72,,,, 75, 80, 86, 87, 89	87	87,
	89	89,

数値は、コンマ、スペース、改行、または複数のタイプの区切り文字の組み合わせで区切ることができます。行形式または列形式のいずれかを使用できます。上記の表に示されているすべての形式について、計算機は入力を44、63、72、75、80、86、87、および89として処理します。

データを入力したら、サンプルデータか母集団データかを選択できます。計算ボタンを押すと、計算機にデータセットの5つの統計パラメータが表示されます: 度数 (観測値の数)、平均、偏差の平方和、分散、標準偏差。

計算機は、データセットの分散を計算するように設計されています。また、計算の背後にある理論についての洞察を提供し、関連するすべてのステップを示します。

推論を行うときは、適切な統計を取得するために大きなデータセットを使用することをお勧めします。しかし、考えられるすべての観測値を表す母集団データを取得することはしばしば困難です。したがって、原則として、母集団から [サンプル]が採取されます。そして、母集団に関する結論は通常、サンプルデータから導き出されます。

分散は、平均に対するデータセットの平均分散を測定します。多くの場合、母集団の場合は σ² で表され、サンプルの場合は s² で表されます。 σ² または s² の値が大きいほど、サンプル平均からのデータポイントの分散が大きくなり、その逆も同様です。

以下のデータ・セットの例を考えてみます。

(セットI) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,

(セットII) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

セットIを分散計算機に接続すると:

n=11

x̄=16

SS=704

s²=70.4

s=8.39

サンプルの場合、および

n=11

μ=16

SS=704

σ²=64

σ=8

人口のため

同様に、セットIIを電卓に接続すると:

n=11

x̄=16

SS=56

s²=5.6

s=2.36

サンプルの場合、および

n=11

μ=16

SS=56

σ²=5.09

σ=2.25

人口のため

-セットIでは、数値はサンプル平均から大幅に逸脱しています

s²=70.4

σ²=64

-セットIIでは、変動は小さいです

s²=5.6

σ²=5.09

分散の計算式: 母分散とサンプル分散

母集団分散

統計における母集団とは、実験で考えられるすべての観測値を指します。N個の観測値の場合、母分散は次のようになります:

$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$

どこ

σ²は母集団分散です,
Σは合計です,
xᵢは各オブザベーション,
μは母平均です,
nは母集団内の観測値の数です。

サンプル分散

サンプル分散は次のように定義されます

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$

どこ

s² は標本分散です,
Σは合計です,
xᵢ は各オブザベーション,
x̄ は標本平均です,
nは、サンプル内の観測値の数です。

分散を計算するための手順

以下の手順が分散計算に関与します。

ステップ 1: サンプル/母集団の平均を計算します。これは、全データ点の合計をデータ点の数（サンプルの場合はn、母集団の場合はN）で割ったものです、すなわち、

サンプル平均:

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$

母集団平均:

$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$

ステップ 2: 各データ点からサンプル/母集団の平均を引いて偏差を計算します、すなわち、

サンプルの偏差:

$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$

母集団の偏差:

$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$

ステップ 3: 各データ点の偏差の二乗を計算します。

サンプルの偏差の二乗:

$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$

母集団の偏差の二乗:

$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$

ステップ 4: 偏差の二乗の合計を計算します。

サンプルの偏差の二乗の合計:

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$

母集団の偏差の二乗の合計:

$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$

ステップ 5: サンプルの場合は n-1 で、母集団の場合は N で偏差の二乗の合計を割って分散を計算します。

サンプルの分散:

$$s^2=\frac{SS}{n-1}$$

母集団の分散:

$$\sigma^2=\frac{SS}{N}$$

標本の分散計算の例

以下のデータセットを考えます：1, 2, 4, 5, 6, および 12。標本分散を計算するには、次の手順に従います：

ステップ 1: 標本平均（平均）を計算する。

$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$

ステップ 2: 各データポイントについて平均からの偏差を計算する。

x₁-x̄	x₂-x̄	x₃-x̄	x₄-x̄	x₅-x̄	x₆-x̄
1 - 5	2 - 5	4 - 5	5 - 5	6 - 5	12 - 5
-4	-3	-1	0	1	7

ステップ 3: 偏差の二乗を計算する。

(x₁-x̄)²	(x₂-x̄)²	(x₃-x̄)²	(x₄-x̄)²	(x₅-x̄)²	(x₆-x̄)²
16	9	1	0	1	49

ステップ 4: 二乗偏差の合計を求める。

$$SS=\sum_{i=1}^{n}{(x_i-\bar{x})}^2=16+9+1+0+1+49=76$$

ステップ 5: 二乗偏差の合計を自由度（n-1）で割って標本分散を計算する。

$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15.2$$

母集団については、標本分散を計算する際に n-1 ではなく n （データポイントの総数）で割ります。

分散の有意性

分散は投資に使用されます。これは、資産運用会社が投資のパフォーマンスを向上させるのに役立ちます。財務アナリストは、差異を使用して、投資ポートフォリオの構成要素の個々のパフォーマンスを評価できます。投資家は、新規購入を検討する際に分散を計算して、投資がリスクに見合う価値があるかどうかを判断します。分散は、アナリストが不確実性の尺度を決定するのに役立ちますが、分散と標準偏差なしで定量化することは困難です。

不確実性は直接測定できません。しかし、分散と標準偏差 (分散の平方根)は、ポートフォリオに対する特定の株式の認識された影響を判断するのに役立ちます。

科学者、統計学者、数学者、およびデータアナリストも分散を使用できます。これは、実験またはサンプル母集団に関する有用な情報を提供するのに役立ちます。

科学者は、テストグループ間の違いを探して、仮説を正常にテストするのに十分類似しているかどうかを判断できます。データセットの分散が大きいほど、データセット内の値のばらつきが大きくなります。データ研究者は、この情報を使用して、平均がデータセットをどの程度適切に表しているかを確認できます。

分散を使用することの欠点は、セット内の大きな外れ値によってデータがいくらか歪む可能性があることです。これは、外れ値が2乗されるとさらに重みが増加する可能性があるためです。

多くの研究者は、分散の平方根として計算された標準偏差を使用することを好みます。標準偏差は外れ値の影響をあまり受けず、数値が小さく、解釈しやすくなります。

分散計算機

目次

変動性測度としての分散

この計算機を使用するためのルール

分散の計算式: 母分散とサンプル分散

母集団分散

サンプル分散

分散を計算するための手順

標本の分散計算の例

分散の有意性