統計計算機
標準偏差と誤差幅計算機


標準偏差と誤差幅計算機

離散データセットを指定すると、計算機はサンプルまたは母集団の平均、分散、および標準偏差を計算し、計算のすべての中間ステップを表示します。

標本 母集団
標準偏差 σ = 5.3385 s = 4.9937
分散 σ2 = 28.5 s2 = 24.9375
カウント n = 8 n = 8
平均 μ = 18.25 x̄ = 18.25
二乗の合計 SS = 199.5 SS = 199.5

計算にエラーがありました。

目次

  1. 標準偏差
  2. 母標準偏差
    1. 一般母集団の標準偏差の計算例
  3. サンプル標準偏差
  4. 許容誤差
  5. 信頼区間
    1. 信頼区間の計算例

標準偏差と誤差幅計算機

標準偏差計算機は、一連の数値の標準偏差を計算します。さらに、平均や分散など、数値に関する追加情報を提供します。計算機は、さまざまな信頼水準のデータセットの信頼区間も計算し、度数分布表を提供します。

この計算機を使用するには、数値をコンマで区切って計算機に入力します。数値が母集団とサンプルのどちらを表すかを選択し、 [計算] をクリックします。[クリア]ボタンを使用すると、電卓をクリアして別の数値セットを入力することもできます。

標準偏差

標準偏差は、特定のデータセットの広がりまたは変動の程度を定義する統計的尺度です。データセットの平均からデータ ポイントの集計平均距離を提供します。標準偏差が小さいほど、データポイントは平均に近くなります。逆に、標準偏差が高いほど、データポイントは平均から遠くなります。標準偏差は、分散と呼ばれる別のスプレッド尺度の平方根です。

標準偏差は、データセットに関する情報に基づいて計算されます。データセットがすべてのデータ対象ポイント (母集団) を表す場合、標準偏差は母標準偏差と呼ばれます。ただし、データセットが母集団からのサンプルを表す場合、標準偏差はサンプル標準偏差と呼ばれます。

母標準偏差

母標準偏差は、データセットが対象の母集団を表すときに計算されます。つまり、データセットは検討中のすべての観測値を表します。母標準偏差は σ で表されます。

σは、シグマと呼ばれるギリシャ文字の小文字です。母標準偏差は、次の式を使用して計算されます:

$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

どこ:

  • Σ はギリシャ語の大文字シグマで、数学で合計を表すために使用されます;
  • xᵢ は、最初のデータポイントからN番目 (最後)のデータポイントまでの各データポイント(データセットの各オブザベーション)を表します;
  • μ 母平均を表します;
  • n は人口規模です。

一般母集団の標準偏差の計算例

次の例は、母集団データの標準偏差を求める方法を示しています。

投資家は、他のクラスの資産と比較してボラティリティが高いため、株式をリスクの高い資産と見なしています。投資マネージャーは、前月の一部の株式のボラティリティを分析したいと考えており、標準偏差が平均以上の株式を [リスクが高すぎる] と考えているため、クライアントに推奨しません。

以下にリストされているのは、前月の株式のすべての日次終値 (米ドル) です。標準偏差を計算し、マネージャーが株式を [リスクが高すぎる] と見なしているかどうかを判断します:

1.31, 1.30, 1.36, 1.40, 1.40, 1.41, 1.27, 1.19, 1.15, 1.12, 0.99, 1.00, 0.97, 0.94, 0.88, 0.90, 0.86, 0.88, 0.80, 0.81

なお、マネージャーは前月の株価のみに関心があり、上記の価格は全て前月の価格です。その結果、私たちは自由に使える人口を持っています。したがって、母集団の標準偏差の公式を使用して標準偏差を計算します。

標準偏差を見つけるには、まず平均を計算します。平均 μ は、数値の合計を数値の数で割ることによって得られることに注意してください。

$$\mu=\frac{1.31+1.30+1.36+1.40+1.40+1.41+1.27+1.19+1.15+1.12+0.99+1.00+0.97+0.94+0.88+0.90+0.86+0.88+0.80+0.81}{20}=1.097$$

次に、各数値から平均を引き、差を2乗します。次に、結果を加算し、結果をカウントで割ります。結果は分散 σ²と呼ばれます。

$$\sigma^2=\frac{\left(1.31-1.097\right)^2+\left(1.30-1.097\right)^2+\left(1.36-1.097\right)^2+\left(1.40-1.097\right)^2+\ldots+\left(0.81-1.097\right)^2}{20}=0.045031$$

最後に、分散の平方根を取り、標準偏差を取得します。

$$\sigma=\sqrt{0.045031}\approx0.21$$

ご覧のとおり、前月のこの株の価格の標準偏差は平均よりも小さくなっています。したがって、マネージャーはこの株を [リスクが高すぎる]とは見なしません。

サンプル標準偏差

サンプル標準偏差は、検討中のデータセットが対象の母集団からのサンプルを表すときに計算されます。データセットは、検討中のすべての観測値からの観測値の小さなセットを表します。サンプル標準偏差は s で表されます。サンプル標準偏差は、次の式を使用して計算されます:

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

どこ:

  • Σ合計を示します;
  • xᵢ各データ ポイントを表します;
  • サンプル平均を表します;
  • nはサンプルサイズです。

母集団の標準偏差と同じ例を使用して、サンプルデータの標準偏差を見つける方法を説明します。しかし、この状況では、投資マネージャーは前月のすべての取引日の終値にアクセスできません。ただし、彼は前月のランダムな5日間の終値を持っています。したがって、彼は利用可能なサンプルからのデータを使用して株価の標準偏差を推定します。

彼が5日間の終値を持っていると仮定しましょう:

1.31, 1.40, 0.86, 0.88, 1.40

マネージャーは前月の株価に関心があることに注意してください。ただし、彼は前月のすべての価格を持っているわけではなく、わずか5日間の終値のごく一部を持っています。したがって、この場合、サンプルを扱っています。サンプル標準偏差式を使用して標準偏差を計算します。

まず、サンプルの平均を計算します。

$$\bar{x}=\frac{1.31+1.40+0.86+0.88+1.40}{5}=1.17$$

次に、分散 $s^2 $を計算します。

$$s^2=\frac{\left(1.31-1.17\right)^2+\left(1.40-1.17\right)^2+\left(0.86-1.17\right)^2+\left(0.88-1.17\right)^2+\left(1.40-1.17\right)^2}{5-1}=0.0764$$

最後に、分散の平方根を取り、標準偏差を取得します。

$$s=\sqrt{0.0764}\approx 0.28$$

許容誤差

標準偏差の用途の1つは、「許容可能な」値の範囲を計算することです。これは、業界の統計的品質保証と予測分析において重要な役割を果たします。検討中の基になるデータが正規分布に従うとします。その場合、この範囲は信頼区間と呼ばれます (次のセクションを参照) 。 これらの信頼区間は、さまざまな信頼水準(またはパーセンテージ)で与えられます。

誤差幅は、信頼区間の幅を示す信頼区間の成分です。つまり、許容誤差は、検討中の数量の最大値と最小値を示します。

許容誤差は、次の式を使用して計算されます:

$$誤差の範囲 = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

母標準偏差 σ がわかっている場合、この式を適用します。同時に、サンプルは十分に大きくなければなりません (通常n>30)。

母標準偏差が未知でサンプルが小さい場合(通常は n≤30)、次の式を使用します:

$$誤差の範囲 = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

この式では、母標準偏差 σ が不明であるため、サンプル標準偏差 s を使用します。

\$z_{\alpha/2}\$ と $t_{n-1, \alpha/2}$は、それぞれ Z 統計量と t 統計量を使用して決定され、棄却限界値と呼ばれます。これらは、信頼レベルに関連付けられた定数です。

統計で使用される最も一般的な信頼区間は、90%、95%、および99%です。また、 \$z_{\alpha/2}\$ の値は 1.645 (90%) の場合、1.96 (95% の場合)、および 2.575 (99% の場合) です。

\$\frac{\sigma}{\sqrt n}\$ または \$\frac{s}{\sqrt n}\$ は標準エラーと呼ばれます。

  • $\frac{\sigma}{\sqrt n}$は、母集団 σ の標準偏差がわかっていて、大きなサンプル (通常は n>30) がある場合に使用されます。

  • $\frac{s}{\sqrt n}$は、母集団の標準偏差がわからず、サンプルが小さい場合(通常は n≤30 )に使用されます。つまり、一般母集団 σ の標準偏差の代わりに、利用可能なサンプルの標準偏差 sを使用する必要があります。

信頼区間

上で紹介したように、信頼区間は、特定の量が特定の信頼水準にあると予想される区間(値の範囲)です。

たとえば、13歳の少女の身長など、一定量は、90%の信頼水準で59インチから66インチの間にあると言えます。つまり、13歳の少女のグループを選択する場合、約90%の確率で、身長は指定された値の間にあります。

信頼区間は、次の式を使用して計算されます:

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

  • は標本平均です,
  • \$z_{\alpha/2}\$は臨界値です,
  • σは母標準偏差です,
  • nは観測値の数です.

母標準偏差 σ がわからず、代わりにサンプル標準偏差 sを使用する必要がある場合、別の式が使用されます:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • は標本平均です,
  • \$t_{n-1,\alpha/2}\$は臨界値です,
  • sはサンプル標準偏差です,
  • nは観測値の数です.

前の章から覚えているように \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ そして \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ は許容誤差です。

信頼区間の計算例

私たちが検討している毎日の株価が正規分布を持っていることがわかっているとします。株価のサンプルを自由に利用できます:

1.31, 1.36, 1.40, 1.27, 1.15, 0.99, 0.97, 0.88, 0.86, 0.80

株価がどの範囲で変動するかを95%の信頼度で計算する必要があります。

これは小さなサンプルであり、母標準偏差がわからないため、サンプル標準偏差と式を使用して計算します:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • は標本平均です, 1.10
  • \$t_{n-1,\alpha/2}\$は臨界値です, \$t_{9,0.025}=2.26\$ 特定のサンプルサイズと信頼水準の棄却限界値は、通常、ZテーブルまたはTテーブルから計算されます
  • sはサンプル標準偏差です, 0.23
  • nは観測値の数です, 10,
  • \$\frac{s}{\sqrt n}\$は標準誤差です \$\frac{0.23}{\sqrt{10}}=0.07\$

そこで、数式に数値を入れます

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

我々は得る:

$$1.10 - 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 - 2.26 (\frac{0.23}{3.16}) = 1.10 - 2.26 × 0.07 = 1.10 - 0.16 = 0.94$$

$$1.10 + 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 + 2.26 (\frac{0.23}{3.16}) = 1.10 + 2.26 × 0.07 = 1.10 + 0.16 = 1.26$$

これは、平均株価が信頼区間 *(0.94, 1.26)*にあることを95%確信していることを意味します。