未找到结果
我们目前无法使用该术语找到任何内容,请尝试搜索其他内容。
给定一个离散数据集,计算器可计算样本或总体的平均值、方差和标准差,并显示所有中间计算步骤。
结果 | |
---|---|
标准偏差 | s = 4.5 |
方差 | s2 = 20.24 |
计数 | n = 7 |
平均数 | x̄ = 14.29 |
平方和 | SS = 100 |
您的计算出现错误。
标准差是描述给定数据集统计特性最常用指标之一。简单来说,标准差是衡量数据集离散程度的指标。通过计算标准差,可以找出数据是接近平均值还是远离平均值。如果数据点远离平均值,那么数据集的偏差就很大。因此,数据越分散,标准差就越大。
该计算器可计算给定数据集的标准差,并显示计算步骤。
该计算器接受以分隔符分隔的数字列表作为输入数据。下表列举了一些可能的输入示例。
行输入 | 列输入 | 列输入 | 列输入 |
---|---|---|---|
44, 63, 72, 75, 80, 86, 87, 89 | 44 | 44, | 44,63,72 |
44 63 72 75 80 86 87 89 | 63 | 63, | 75,80 |
44,, 63,, 72, 75, 80, 86, 87, 89 | 72 | 72, | 86,87 |
44 63 72 75, 80, 86, 87, 89 | 75 | 75, | 89 |
44; 63; 72, 75,, 80, 86, 87, 89 | 80 | 80, | |
44,,, 63,, 72, 75, 80, 86, 87, 89 | 86 | 86, | |
44 63,, 72,,,, 75, 80, 86, 87, 89 | 87 | 87, | |
89 | 89, |
数字可以用逗号/空格/换行符分隔,也可以混合使用,还可以按行或列格式插入。对于上表中的所有格式,计算器处理的输入值为 44、63、72、75、80、86、87 和 89。
输入数据后,选择是样本数据还是总体数据,然后点击回车。计算器会显示数据集的五个统计参数:计数(观察数)、平均数、平方差总和、方差和标准差。
计算器旨在计算离散数据集的标准差,并提供计算背后的步骤。
数据可能包括在指定条件下实验的所有可能观察结果构成的总体。在许多情况下,不可能对每个总体个体进行抽样。
这就是为什么统计学经常从 "总体 "中抽取一个子集,并称之为 "样本"。对总体的推断通常是通过样本进行的。样本和总体的标准差计算略有不同。其不同之处在于自由度因子。
标准差衡量数据集相对于平均值的平均离散度/偏差/变异性。通常用希腊字母 σ 表示总体标准差,用 s 表示样本标准差。σ 或 s 的值越大,意味着数据点与总体或样本平均值的离散度越大,反之亦然。
请看下面的数据集示例。
(数据集I)
11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27
(数据集II)
12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20
将这些数据集代入计算器后,我们得到数据集I的结果:
对于数据集II:
在数据集I中,数值与样本均值(s=8.39)相差较大,而在数据集II中,变异性相对较小(s=2.36),与数据集I相比。
当分析总体的所有值时,使用以下公式:
$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$
当总体很大,只采用其样本进行分析时,使用下面的公式:
$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$
计算标准差的步骤如下:
步骤1: 计算样本/总体平均值。它是所有数据点的总和除以数量数量 N 或 n,即
样本平均值:
$$\bar{x}=\frac{x₁+x₂+x_3+........+x_n}{n}$$
总体平均值
$$\mu=\frac{x₁+x₂+x_3+........+x_N}{N}$$
步骤2: 从每个数据点减去样本/总体平均值,计算偏差,即
样本偏差:
$$(x₁-\bar{x}), (x₂-\bar{x}), (x_3-\bar{x})…………………… (x_n-\bar{x})$$
总体偏差:
$$(x₁-\ \mu), (x₂-\ \mu), (x_3-\ \mu)……………….. (x_N-\ \mu)$$
步骤3: 计算每个数据点的平方差。
样本平方差:
$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x_3-\bar{x})^2…………………… (x_n-\bar{x})^2$$
总体平方差:
$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (x_3-\ \mu)^2……………….. (x_N-\ \mu)^2$$
步骤4: 将所有单个平方差相加,计算平方差之和
样本平方差总和:
$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x_3-\bar{x})^2……………………+(x_n-\bar{x})^2$$
总体平方差总和:
$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(x_3-\ \mu)^2……………….+ (x_N-\ \mu)^2$$
步骤5: 将这个数值除以总体或样本的大小,即可得到方差。计算器通过平方差之和除以自由度的数量来计算方差:样本为 N,总体为 n-1。
样本差异
$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$
总体差异
$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$
在计算样本方差时,我们可以假设我们将使用以下表达式进行计算:
$$\frac{(x-\bar{x})^2}{n}$$
其中
x̄ 是样本平均数,n 是样本容量。但实际上不使用这样的公式。
这样的表达式不能很好地估计总体的方差。当总体非常庞大而样本非常小的情况下,通过这个公式计算出的方差会低估总体的方差。这将由于数据不足而显示出太小的方差。因此,通过使用表达式 n-1,我们增加了潜在的方差值。
我们不除以 n,而是通过除以 n-1 来求得样本的方差。这一操作得出的方差值略大,更接近实际值。
步骤6: 求出所得数字的平方根。标准差就是方差的平方根。
样本标准差
$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$
总体标准差
$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$
让我们来看看 n=8 名学生的物理期末考试成绩:
45、67、70、75、80、81、82 和 84。
计算器通过以下步骤计算总体的标准差:
步骤 1: 计算平均值。
$$\bar{x}=\frac{\sum_{i} x_i}{n}=\frac{45+\ 67+\ 70+\ 75+\ 80+\ 81+\ 82+\ 84}{8}=73$$
步骤2: 计算偏差
x₁-x̄ | x₂-x̄ | x₃-x̄ | x₄-x̄ | x₅-x̄ | x₆-x̄ | x₇-x̄ | x₈-x̄ |
---|---|---|---|---|---|---|---|
45-73 | 67-73 | 70-73 | 75-73 | 80-73 | 81-73 | 82-73 | 84-73 |
-28 | -6 | -3 | 2 | 7 | 8 | 9 | 11 |
步骤3: 计算偏差的平方
(x₁-x̄)² | (x₂-x̄)² | (x₃-x̄)² | (x₄-x̄)² | (x₅-x̄)² | (x₆-x̄)² | (x₇-x̄)² | (x₈-x̄)² |
---|---|---|---|---|---|---|---|
784 | 36 | 9 | 4 | 49 | 64 | 81 | 121 |
步骤4: 求偏差平方和。
$$SS=\sum_{i}^{n}{{(x_i-\ \bar{x})}^2=784+36+9+4+49+64+81+121}=1148$$
步骤5: 用平方差之和除以自由度 (n-1),计算方差。对于一个总体,这一步的方差将除以 N,而不是 N-1。在这种情况下,我们得到的是样本,即部分学生的数据,而不是整个总体的数据。
$$s^2=\ \frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}=\frac{1148}{8-1}=164$$
步骤: 求方差的平方根,得到标准差。
$$s=\sqrt{s^2}=\ \sqrt{164}=12.80$$
离散度和标准差可用于确定数据的分散程度。如果方差或标准差较大,则数据较为分散。在比较两个(或更多)数据集以确定哪个更具变异性时,此信息非常有用。
在工业领域,标准差被广泛用于质量控制。在大规模生产中,某些产品的特性必须在一个确定的范围内,通过计算标准差就可以获得这个范围。例如,在生产螺母和螺栓时,其直径的变化必须很小,否则,零件就无法安装在一起。
标准差用于金融和许多其他领域的风险评估。在技术分析中,标准差用于构建布林线和计算波动率。
此外,标准差在金融领域中被用来衡量波动性,而在社会学中,标准差被用于民意调查,以帮助计算不确定性。
方差和标准差用于确定落入给定分布间隔的数据值数量。例如,切比雪夫的定理显示,对于任何分布,至少有 75% 的数据值将落入均值的 2 个标准差之内。
让我们用一个气候的简单例子来说明。假设我们研究同一地区两个城市的日气温。一个城市位于沿海,另一个城市位于内陆。这两个城市的日平均最高气温可能相同。但是,内陆城市的标准差,即最高日气温的分散度会更大,而沿海城市的最高日气温标准差会更小。
这意味着内陆城市在一年中的任何给定天的最高气温变化更大。也就是说,沿海城市的气候更温和。