未找到结果
我们目前无法使用该术语找到任何内容,请尝试搜索其他内容。
给定一个离散数据集,计算器可计算样本或总体的均值、方差和标准差,并显示所有中间计算步骤。
样本 | 总体 | |
---|---|---|
标准差 | σ = 5.3385 | s = 4.9937 |
方差 | σ2 = 28.5 | s2 = 24.9375 |
计数 | n = 8 | n = 8 |
平均值 | μ = 18.25 | x̄ = 18.25 |
平方和 | SS = 199.5 | SS = 199.5 |
您的计算出现错误。
标准差计算器可计算一组数字的标准差。此外,它还提供有关数字的其他信息,包括平均值和方差。计算器还能计算不同置信水平下数据集的置信区间,并提供频率分布表。
要使用该计算器,请将数字输入计算器,中间用逗号隔开。选择数字是代表总体还是样本,然后点击 "计算"。
标准差是一种统计量度,用于定义给定数据集的分散程度或变异性程度。它提供了数据点与数据集平均值之间的平均距离。标准差越小,数据点越接近平均值。反之,标准差越大,数据点离均值越远。标准差是方差的平方根,方差也可用于分布度量。
标准差是根据数据集的信息计算出来的。如果数据集代表所有相关数据点(总体),则标准差称为总体标准差。但是,如果数据集代表的是从总体中抽取的样本,则标准差称为样本标准差。
总体标准差是在数据集代表总体时计算得出的。也就是说,数据集代表了所有的观测值。总体标准差用 σ 表示。
σ 是希腊字母 Sigma 的小写。总体标准差的计算公式为
$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$
其中:
下面的示例展示了如何求出总体数据的标准差。
投资者认为股票是一种风险资产,因为与其他类别的资产相比,股票的波动性很高。一位投资经理想分析一些股票上个月的波动性,他不会向客户推荐任何标准差大于或等于平均值的股票,因为他认为这样的股票 "风险太大"。
下面列出了上个月所有股票的每日收盘价(美元)。请计算标准差,并判断经理是否认为该股票 "风险太大":
1.31, 1.30, 1.36, 1.40, 1.40, 1.41, 1.27, 1.19, 1.15, 1.12, 0.99, 1.00, 0.97, 0.94, 0.88, 0.90, 0.86, 0.88, 0.80, 0.81
请注意,经理只关心上个月的股票价格,而上面列出的价格都是上个月的价格。因此,我们得到了总体数据,可使用总体标准差公式计算标准差。
要计算标准差,首先要计算平均数。请记住,平均数 μ 是用数字的总和除以数字的个数得出的。
$$\mu=\frac{1.31+1.30+1.36+1.40+1.40+1.41+1.27+1.19+1.15+1.12+0.99+1.00+0.97+0.94+0.88+0.90+0.86+0.88+0.80+0.81}{20}=1.097$$
然后,从每个数字中减去平均数,再将差值平方。然后将结果相加,再除以计数。所得结果称为方差 σ²。
$$\sigma^2=\frac{\left(1.31-1.097\right)^2+\left(1.30-1.097\right)^2+\left(1.36-1.097\right)^2+\left(1.40-1.097\right)^2+\ldots+\left(0.81-1.097\right)^2}{20}=0.045031$$
最后,取方差的平方根得出标准偏差。
$$\sigma=\sqrt{0.045031}\approx0.21$$
可以看出,该股票上个月价格的标准差小于平均值。因此,经理不会认为这只股票 "风险太大"。
样本标准差是在所考虑的数据集代表相关群体的样本时计算得出的。该数据集代表所有观测值中较小的一组观测值。样本标准差用 s 表示。样本标准差的计算公式为
$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$
其中:
我们将用与求总体标准差相同的例子来说明如何求样本数据的标准差。但在这种情况下,投资经理无法获得上个月所有交易日的收盘价。不过,他有上个月随机 5 个交易日的收盘价。因此,他将利用现有样本中的数据估算股票收盘价的标准差。
假设他有 5 天的收盘价:
1.31, 1.40, 0.86, 0.88, 1.40
请注意,经理只对上个月的股票价格感兴趣。然而,他并没有上个月的所有价格,只有 5 天的收盘价。因此,在这种情况下,我们要处理的是一个样本。我们将使用样本标准差公式计算标准差。
首先,计算样本的平均值。
$$\bar{x}=\frac{1.31+1.40+0.86+0.88+1.40}{5}=1.17$$
接下来,计算方差 s²。
$$s^2=\frac{\left(1.31-1.17\right)^2+\left(1.40-1.17\right)^2+\left(0.86-1.17\right)^2+\left(0.88-1.17\right)^2+\left(1.40-1.17\right)^2}{5-1}=0.0764$$
最后,取方差的平方根得出标准偏差。
$$s=\sqrt{0.0764}\approx 0.28$$
标准差的用途之一是计算 "可接受 "的数值范围。这在行业统计质量保证和预测分析中发挥着重要作用。假设所考虑的基础数据遵循正态分布。在这种情况下,这个范围被称为置信区间(请参阅下一节)。这些置信区间按不同的置信水平(或百分比)给出。
误差范围是置信区间的一个组成部分,它给出置信区间的宽度。也就是说,误差范围给出了所考虑数量的最大和最小可接受值。
误差幅度用公式计算:
$$误差范围 = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$
如果已知总体标准偏差 σ,我们就可以应用该公式。同时,样本应该足够大(通常为 n>30)。
当总体标准偏差未知且样本较少时(通常 n≤30),我们使用下面的公式:
$$误差范围 = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$ 在这个公式中,我们使用样本标准偏差 s,因为不知道总体标准偏差 σ。
\$z_{\alpha/2}\$ 和 \$t_{n-1, \alpha/2}\$ 分别用 z 统计量和 t 统计量确定,称为临界值。它们是与置信水平相关的常数。
统计中最常用的置信区间是 90%、95% 和 99%。其\$z_{\alpha/2}\$值分别为 1.645(90%)、1.96(95%)和 2.575(99%)。
\$\frac{\sigma}{\sqrt n}\$ 或 \$\frac{s}{\sqrt n}\$ 被称为标准误差。
如上所述,置信区间是一个区间(数值范围),在一定置信水平下,给定数量预计会位于该区间内。
例如,我们可以说,在 90% 的置信水平下,某个数值,比如 13 岁女孩的身高,介于 59 英寸和 66 英寸之间。也就是说,如果我们要挑选一组 13 岁的女孩,大约 90% 的情况下,她们的身高会介于给定的值范围内。
置信区间用公式计算:
$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$
当我们不知道总体标准偏差 σ,而必须使用样本标准偏差 s 时,就会用到另一个公式:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
正如我们在上一章中所记得的, \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ 和 \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ 是误差范围。
假设我们知道所考虑的每日股票价格具有正态分布。我们有一个股票价格样本:
1.31, 1.36, 1.40, 1.27, 1.15, 0.99, 0.97, 0.88, 0.86, 0.80
我们需要以 95% 的置信度计算出股票价格的波动范围。
这是一个小样本,我们不知道总体标准偏差,因此我们将使用样本标准偏差和公式来计算:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
因此,我们将这些数字输入公式
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
我们得到
$$1.10 - 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 - 2.26 (\frac{0.23}{3.16}) = 1.10 - 2.26 × 0.07 = 1.10 - 0.16 = 0.94$$
$$1.10 + 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 + 2.26 (\frac{0.23}{3.16}) = 1.10 + 2.26 × 0.07 = 1.10 + 0.16 = 1.26$$
这意味着我们有 95% 的把握平均股价位于置信区间 (0.94,1.26) 内。