统计计算器
标准偏差计算器


标准偏差计算器

给定一个离散数据集,计算器可计算样本或总体的均值、方差和标准差,并显示所有中间计算步骤。

样本 总体
标准差 σ = 5.3385 s = 4.9937
方差 σ2 = 28.5 s2 = 24.9375
计数 n = 8 n = 8
平均值 μ = 18.25 x̄ = 18.25
平方和 SS = 199.5 SS = 199.5

您的计算出现错误。

目录

  1. 标准差
  2. 总体标准差
    1. 计算一般总体标准差的示例
  3. 样本标准偏差
  4. 误差幅度
  5. 置信区间
    1. 置信区间计算示例

标准偏差计算器

标准差计算器可计算一组数字的标准差。此外,它还提供有关数字的其他信息,包括平均值和方差。计算器还能计算不同置信水平下数据集的置信区间,并提供频率分布表。

要使用该计算器,请将数字输入计算器,中间用逗号隔开。选择数字是代表总体还是样本,然后点击 "计算"。

标准差

标准差是一种统计量度,用于定义给定数据集的分散程度或变异性程度。它提供了数据点与数据集平均值之间的平均距离。标准差越小,数据点越接近平均值。反之,标准差越大,数据点离均值越远。标准差是方差的平方根,方差也可用于分布度量。

标准差是根据数据集的信息计算出来的。如果数据集代表所有相关数据点(总体),则标准差称为总体标准差。但是,如果数据集代表的是从总体中抽取的样本,则标准差称为样本标准差。

总体标准差

总体标准差是在数据集代表总体时计算得出的。也就是说,数据集代表了所有的观测值。总体标准差用 σ 表示。

σ 是希腊字母 Sigma 的小写。总体标准差的计算公式为

$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

其中:

  • Σ 是希腊文大写字母 Sigma,在数学中用来表示求和;
  • xᵢ 表示从第一个数据点到第 N 个(最后一个)数据点的每个数据点(数据集中的每个观测点);
  • μ 代表群体平均值;
  • n 是总体数量。

###计算一般总体标准差的示例

下面的示例展示了如何求出总体数据的标准差。

投资者认为股票是一种风险资产,因为与其他类别的资产相比,股票的波动性很高。一位投资经理想分析一些股票上个月的波动性,他不会向客户推荐任何标准差大于或等于平均值的股票,因为他认为这样的股票 "风险太大"。

下面列出了上个月所有股票的每日收盘价(美元)。请计算标准差,并判断经理是否认为该股票 "风险太大":

1.31, 1.30, 1.36, 1.40, 1.40, 1.41, 1.27, 1.19, 1.15, 1.12, 0.99, 1.00, 0.97, 0.94, 0.88, 0.90, 0.86, 0.88, 0.80, 0.81

请注意,经理只关心上个月的股票价格,而上面列出的价格都是上个月的价格。因此,我们得到了总体数据,可使用总体标准差公式计算标准差。

要计算标准差,首先要计算平均数。请记住,平均数 μ 是用数字的总和除以数字的个数得出的。

$$\mu=\frac{1.31+1.30+1.36+1.40+1.40+1.41+1.27+1.19+1.15+1.12+0.99+1.00+0.97+0.94+0.88+0.90+0.86+0.88+0.80+0.81}{20}=1.097$$

然后,从每个数字中减去平均数,再将差值平方。然后将结果相加,再除以计数。所得结果称为方差 σ²。

$$\sigma^2=\frac{\left(1.31-1.097\right)^2+\left(1.30-1.097\right)^2+\left(1.36-1.097\right)^2+\left(1.40-1.097\right)^2+\ldots+\left(0.81-1.097\right)^2}{20}=0.045031$$

最后,取方差的平方根得出标准偏差。

$$\sigma=\sqrt{0.045031}\approx0.21$$

可以看出,该股票上个月价格的标准差小于平均值。因此,经理不会认为这只股票 "风险太大"。

样本标准偏差

样本标准差是在所考虑的数据集代表相关群体的样本时计算得出的。该数据集代表所有观测值中较小的一组观测值。样本标准差用 s 表示。样本标准差的计算公式为

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

其中:

  • Σ 表示求和;
  • xᵢ 代表每个数据点;
  • 代表样本平均数;
  • n 是样本数。

我们将用与求总体标准差相同的例子来说明如何求样本数据的标准差。但在这种情况下,投资经理无法获得上个月所有交易日的收盘价。不过,他有上个月随机 5 个交易日的收盘价。因此,他将利用现有样本中的数据估算股票收盘价的标准差。

假设他有 5 天的收盘价:

1.31, 1.40, 0.86, 0.88, 1.40

请注意,经理只对上个月的股票价格感兴趣。然而,他并没有上个月的所有价格,只有 5 天的收盘价。因此,在这种情况下,我们要处理的是一个样本。我们将使用样本标准差公式计算标准差。

首先,计算样本的平均值。

$$\bar{x}=\frac{1.31+1.40+0.86+0.88+1.40}{5}=1.17$$

接下来,计算方差

$$s^2=\frac{\left(1.31-1.17\right)^2+\left(1.40-1.17\right)^2+\left(0.86-1.17\right)^2+\left(0.88-1.17\right)^2+\left(1.40-1.17\right)^2}{5-1}=0.0764$$

最后,取方差的平方根得出标准偏差。

$$s=\sqrt{0.0764}\approx 0.28$$

误差幅度

标准差的用途之一是计算 "可接受 "的数值范围。这在行业统计质量保证和预测分析中发挥着重要作用。假设所考虑的基础数据遵循正态分布。在这种情况下,这个范围被称为置信区间(请参阅下一节)。这些置信区间按不同的置信水平(或百分比)给出。

误差范围是置信区间的一个组成部分,它给出置信区间的宽度。也就是说,误差范围给出了所考虑数量的最大和最小可接受值。

误差幅度用公式计算:

$$误差范围 = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

如果已知总体标准偏差 σ,我们就可以应用该公式。同时,样本应该足够大(通常为 n>30)。

当总体标准偏差未知且样本较少时(通常 n≤30),我们使用下面的公式:

$$误差范围 = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$ 在这个公式中,我们使用样本标准偏差 s,因为不知道总体标准偏差 σ

\$z_{\alpha/2}\$ 和 \$t_{n-1, \alpha/2}\$ 分别用 z 统计量和 t 统计量确定,称为临界值。它们是与置信水平相关的常数。

统计中最常用的置信区间是 90%、95% 和 99%。其\$z_{\alpha/2}\$值分别为 1.645(90%)、1.96(95%)和 2.575(99%)。

\$\frac{\sigma}{\sqrt n}\$ 或 \$\frac{s}{\sqrt n}\$ 被称为标准误差。

  • 当我们知道群体的标准偏差 σ 并且我们有一个大样本(通常 n>30 )时,就会用到 \$\frac{\sigma}{\sqrt n}\$ 。
  • \$\frac{s}{\sqrt n}\$ 用于我们不知道总体的标准偏差,而我们只有一个小样本(通常 n≤30)的情况。也就是说,我们必须使用可用样本的标准差 s,而不是总体的标准差σ

置信区间

如上所述,置信区间是一个区间(数值范围),在一定置信水平下,给定数量预计会位于该区间内。

例如,我们可以说,在 90% 的置信水平下,某个数值,比如 13 岁女孩的身高,介于 59 英寸和 66 英寸之间。也就是说,如果我们要挑选一组 13 岁的女孩,大约 90% 的情况下,她们的身高会介于给定的值范围内。

置信区间用公式计算:

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

  • 是样本平均数、
  • \$z_{\alpha/2}\$ 是临界值、
  • σ 为总体标准偏差、
  • n 是观测数据的数量。

当我们不知道总体标准偏差 σ,而必须使用样本标准偏差 s 时,就会用到另一个公式:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • 是样本平均数、
  • \$t_{n-1,\alpha/2}\$ 是临界值、
  • s 为样本标准偏差、
  • n 是观测数据的数量。

正如我们在上一章中所记得的, \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ 和 \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ 是误差范围。

置信区间计算示例

假设我们知道所考虑的每日股票价格具有正态分布。我们有一个股票价格样本:

1.31, 1.36, 1.40, 1.27, 1.15, 0.99, 0.97, 0.88, 0.86, 0.80

我们需要以 95% 的置信度计算出股票价格的波动范围。

这是一个小样本,我们不知道总体标准偏差,因此我们将使用样本标准偏差和公式来计算:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • 为样本平均数,1.10
  • \$t_{n-1,\alpha/2}$ 是临界值, \$t_{9, 0.025}\$ = 2.26(给定样本量和置信水平的临界值通常由 z 表或 t 表计算得出)。
  • s 是样本标准偏差,0.23
  • n 是观测值的数量,10
  • \$\frac{s}{\sqrt n}\$ 是标准误差 \$\frac{0.23}{\sqrt{10}}=0.07\$

因此,我们将这些数字输入公式

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

我们得到

$$1.10 - 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 - 2.26 (\frac{0.23}{3.16}) = 1.10 - 2.26 × 0.07 = 1.10 - 0.16 = 0.94$$

$$1.10 + 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 + 2.26 (\frac{0.23}{3.16}) = 1.10 + 2.26 × 0.07 = 1.10 + 0.16 = 1.26$$

这意味着我们有 95% 的把握平均股价位于置信区间 (0.94,1.26) 内。