통계 계산기
표준 편차


표준 편차

이 계산기는 이산 데이터 세트를 주어지면 표본 또는 모집단의 평균, 분산, 그리고 표준 편차를 계산하고 계산의 모든 중간 단계를 보여줍니다.

결과
표준 편차 s = 4.5
분산 s2 = 20.24
개수 n = 7
평균 x̄ = 14.29
제곱의 합 SS = 100

계산에 오류가 있었습니다.

목차

  1. 통계적 척도로서의 표준 편차
  2. 이 계산기를 사용하는 규칙
  3. 이 계산기가 해결하려는 문제들
  4. 표준 편차 계산을 위한 공식
  5. 표준 편차 계산
  6. 샘플의 표준 편차 계산 예제
  7. 표준 편차의 응용

표준 편차

통계적 척도로서의 표준 편차

표준 편차는 주어진 데이터 세트의 통계를 특성화하는 데 가장 흔히 사용되는 지표 중 하나입니다. 간단히 말해서, 표준 편차는 데이터 세트가 얼마나 퍼져 있는지를 나타내는 척도입니다. 표준 편차를 계산함으로써, 숫자들이 평균에 가까운지 아니면 멀리 떨어져 있는지를 알 수 있습니다. 데이터 포인트가 평균에서 멀리 떨어져 있으면, 데이터 세트에서 큰 편차가 있음을 의미합니다. 따라서 데이터의 분산이 클수록 표준 편차는 높아집니다.

이 계산기는 주어진 데이터 세트의 표준 편차를 정의하고 계산에 관련된 수학적 단계를 표시합니다.

이 계산기를 사용하는 규칙

계산기는 구분자로 구분된 숫자 목록을 입력으로 받습니다. 아래 표에 나와 있는 몇 가지 예시를 통해 가능한 입력을 확인할 수 있습니다.

행 입력 열 입력 열 입력 열 입력
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

숫자들은 쉼표/공백/줄 바꿈 또는 이들의 혼합으로 구분될 수 있으며, 행 또는 열 형식으로 입력될 수 있습니다. 위 표에 나타난 모든 형식에 대해, 계산기는 입력을 44, 63, 72, 75, 80, 86, 87, 89로 처리합니다.

데이터를 입력한 후, 해당 데이터가 표본인지 모집단인지를 선택하고 엔터를 누릅니다. 계산기는 데이터 세트의 다섯 가지 통계적 매개변수를 표시합니다: 관측치 수, 평균, 제곱편차의 합, 분산, 그리고 표준 편차.

이 계산기가 해결하려는 문제들

이 계산기는 이산 데이터 세트의 표준 편차를 계산하고 계산 뒤에 있는 이론에 대한 통찰력을 제공하도록 설계되었습니다.

데이터는 지정된 조건에서 실험(어떤 종류든)에서 가능한 모든 관측치로 구성된 모집단으로 구성될 수 있습니다. 많은 경우, 각 모집단 구성원을 샘플링하는 것이 불가능합니다.

통계 실무에서는 '모집단'이라고 하는 더 큰 집합의 부분집합인 '샘플'로 작업하는 것이 일반적입니다. 이는 모집단의 모든 개인으로부터 데이터를 수집하는 것이 실질적으로 불가능하거나 불가능하기 때문입니다. 우리는 샘플로부터 수집한 정보를 바탕으로 모집단에 대한 추정이나 추론을 합니다.

표준 편차를 계산할 때, 우리가 샘플이나 전체 모집단을 다루고 있는지에 따라 사용하는 공식이 조정됩니다. 이 조정은 '자유도'로 알려진 요소를 통해 이루어집니다. 샘플의 경우, 분산을 계산할 때 n 대신 n - 1 (n은 샘플 크기)로 나누며, 이는 표준 편차를 찾기 위해 제곱됩니다. 이 수정은 우리가 모집단 표준 편차를 추정하기 위해 샘플 데이터를 사용하고 있음을 보상하고, 우리의 추정이 편향되지 않도록 합니다.

표준 편차는 데이터 세트의 평균 분산/편차/변동성을 측정합니다. 이는 종종 모집단에 대해서는 그리스 문자 σ로, 샘플에 대해서는 s로 표시됩니다. σ 또는 s의 값이 클수록 샘플 평균에서 데이터 포인트의 분산이 크고 그 반대도 마찬가지입니다.

다음은 데이터 세트의 예입니다.

(세트 I)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

(세트 II)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20 이 데이터 세트를 계산기에 대입하면, 세트 I에 대해

  • x̄=16 - 평균값
  • s=8.3904708 - 표준 편차

세트 II에 대해

  • x̄=16 - 평균값
  • s=2.3664319 - 표준 편차

세트 I에서는 숫자들이 샘플 평균에서 상당히 벗어났습니다(s=8.39) 반면, 세트 II에서는 변동성이 작습니다(s=2.36) 세트 I에 비해.

표준 편차 계산을 위한 공식

이 공식은 모집단의 모든 값이 분석될 때 적용됩니다.

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ는 모집단의 표준 편차입니다,
  • xᵢ는 모집단의 개별 값입니다,
  • μ는 모집단의 산술 평균입니다,
  • n은 모집단의 크기입니다.

아래 공식은 모집단의 크기가 매우 크고 그 중 일부 샘플만 분석을 위해 취해질 때 사용됩니다.

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s는 샘플의 표준 편차입니다,
  • xᵢ는 샘플의 개별 값입니다,
  • 는 샘플의 평균입니다,
  • n은 샘플 크기입니다.

표준 편차 계산

표준 편차를 계산하는 데에는 다음 단계들이 포함됩니다.

단계 1: 샘플/모집단의 평균을 계산합니다. 이는 모든 데이터 포인트의 합을 N 또는 n으로 나눈 값입니다.

샘플 평균:

$$\bar{x}=\frac{x₁+x₂+x₃+........+x_n}{n}$$

모집단 평균

$$\mu=\frac{x₁+x₂+x₃+........+x_N}{N}$$

단계 2: 각 데이터 포인트에서 샘플/모집단 평균을 빼서 편차를 계산합니다.

샘플 편차:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x₃-\bar{x})…………………… (x_n-\bar{x})$$

모집단 편차:

$$(x₁-\ \mu), (x₂-\ \mu), (x₃-\ \mu)……………….. (x_N-\ \mu)$$

단계 3: 각 데이터 포인트의 제곱 편차를 계산합니다.

샘플 제곱 편차:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x₃-\bar{x})^2…………………… (x_n-\bar{x})^2$$

모집단 제곱 편차:

$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (x₃-\ \mu)^2……………….. (x_N-\ \mu)^2$$

단계 4: 모든 개별 제곱 편차를 더하여 제곱 편차의 합을 계산합니다

샘플 제곱 편차 합:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x₃-\bar{x})^2……………………+(x_n-\bar{x})^2$$

모집단 제곱 편차 합:

$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(x₃-\ \mu)^2……………….+ (x_N-\ \mu)^2$$

단계 5: 제곱 편차의 합을 자유도의 수로 나누어 분산을 얻습니다. 모집단의 경우 N으로 나누고, 샘플의 경우 n-1로 나눕니다.

샘플 분산

$$ s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1} $$

모집단 분산

$$ \sigma^2 = \frac{\sum_{i=1}^{N}(xᵢ - \mu)^2}{N} $$

샘플의 분산을 계산할 때, 계산에 다음 표현식을 사용한다고 가정할 수 있습니다:

$$\frac{(x-\bar{x})^2}{n}$$

여기서

x̄는 샘플 평균이고 n은 샘플 크기입니다. 그러나 이러한 공식은 사용되지 않습니다.

이러한 표현식은 모집단의 분산에 대한 좋은 추정치를 제공하지 않습니다. 일반 모집단이 매우 크고 샘플이 매우 작을 때, 이 공식으로 계산된 분산은 모집단의 분산을 과소평가하게 됩니다. 이는 데이터 부족으로 인해 분산이 너무 작게 나타나는 것을 보여줍니다. 따라서 n-1 표현식을 사용함으로써 잠재적인 분산 값을 증가시킵니다.

n으로 나누는 대신, n-1로 나누어 샘플의 분산을 찾습니다. 이 연산은 실제 값에 더 가까운 약간 더 큰 분산 값을 제공합니다.

단계 6: 결과 숫자의 제곱근을 추출합니다. 표준 편차는 분산의 제곱근입니다.

샘플 표준 편차

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$

모집단 표준 편차

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$

샘플의 표준 편차 계산 예제

물리학 기말고사에서 n=8명의 학생들의 다음 점수를 고려해 보겠습니다:

45, 67, 70, 75, 80, 81, 82, 그리고 84

계산기는 다음 단계를 사용하여 샘플의 표준 편차를 계산합니다:

단계 1: 평균을 계산합니다.

$$\bar{x}=\frac{\sum_{i} x_i}{n}=\frac{45+\ 67+\ 70+\ 75+\ 80+\ 81+\ 82+\ 84}{8}=73$$

단계 2: 편차를 계산합니다

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

단계 3: 편차의 제곱 계산하기

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

단계 4: 제곱된 편차의 합을 계산합니다.

$$SS=\sum_{i}^{n}{{(x_i-\ \bar{x})}^2=784+36+9+4+49+64+81+121}=1148$$

단계 5: 자유도(n-1)로 제곱된 편차의 합을 나누어 분산을 계산합니다. 모집단의 경우, 이 단계에서의 분산은 N-1이 아닌 N으로 나눕니다. 이 경우에는 샘플, 즉 학생 인구의 일부에 대한 데이터를 가지고 있으므로, 전체 모집단이 아닙니다.

$$s^2=\ \frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}=\frac{1148}{8-1}=164$$

단계 6: 분산의 제곱근을 취해 표준 편차를 구합니다.

$$s=\sqrt{s^2}=\ \sqrt{164}=12.80$$

표준 편차의 응용

분산과 표준 편차는 데이터의 분산 정도를 판단하는 데 사용될 수 있습니다. 분산이나 표준 편차가 크면 데이터가 더 퍼져 있습니다. 이 정보는 두 개(또는 그 이상)의 데이터 세트를 비교하여 어느 것이 더(가장) 변동성이 큰지 결정할 때 유용합니다.

산업에서는 표준 편차가 품질 관리에 널리 사용됩니다. 대규모 생산에서는 특정 제품 특성이 계산을 통해 접근할 수 있는 정의된 범위 내에 있어야 합니다. 예를 들어, 너트와 볼트 생산에서는 그 직경의 변화가 작아야 하며, 그렇지 않으면 부품이 맞지 않게 됩니다.

금융 및 여러 다른 분야에서 표준 편차는 위험 평가에 사용됩니다. 기술 분석에서는 표준 편차를 사용하여 볼린저 밴드를 구성하고 변동성을 계산합니다.

또한, 표준 편차는 금융에서 변동성의 척도로, 사회학에서는 여론 조사에서 불확실성을 계산하는 데 도움이 되는 데 사용됩니다.

분산과 표준 편차는 주어진 분포 간격 내에 있는 데이터 값의 수를 결정하는 데 사용됩니다. 예를 들어, 체비쇼프의 정리는 어떤 분포에 대해서도 적어도 75%의 데이터 값이 평균으로부터 2 표준 편차 내에 있을 것이라고 보여줍니다.

간단한 예로 기후를 들어 보겠습니다. 같은 지역의 두 도시의 일일 최고 온도를 연구한다고 가정해 보겠습니다. 한 도시는 해안가에 있고 다른 도시는 내륙에 있습니다. 이 두 도시의 일일 최고 평균 온도는 같을 수 있습니다. 그러나 표준 편차, 즉 일일 최고 온도의 분산은 대륙에 위치한 도시가 더 클 것이고, 해안 도시는 일일 최고 온도의 표준 편차가 더 작을 것입니다.

이는 대륙 도시가 해안 도시에 비해 한 해 중 어느 날에나 최고 기온의 변동이 더 클 것임을 의미합니다. 즉, 해안 도시는 더 온화한 기후를 가질 것입니다.