결과를 찾을 수 없습니다
현재 그 용어로는 아무것도 찾을 수 없습니다, 다른 것을 검색해보세요.
샘플 또는 모집단을 대표하는 이산 데이터 세트가 주어지면, 계산기는 평균, 분산, 표준 편차를 계산하고 계산에 관련된 작업 흐름을 표시합니다.
샘플 | 인구 | |
---|---|---|
분산 | σ2 = 28.5 | s2 = 24.9375 |
표준 편차 | σ = 5.3385 | s = 4.9937 |
개수 | n = 8 | n = 8 |
평균 | μ = 18.25 | x̄ = 18.25 |
제곱의 합 | SS = 199.5 | SS = 199.5 |
계산에 오류가 있었습니다.
주어진 데이터 세트의 통계적 추론의 기본적인 측면 중 하나는 평균으로부터 데이터의 변동성을 특성화하는 척도를 측정하는 것입니다. 변동성을 측정하는 가장 인기 있는 지표는 다음과 같습니다:
이 계산기는 주어진 데이터 세트의 분산을 찾고 계산에 관련된 단계를 표시합니다.
분산 계산기는 구분자로 구분된 숫자 목록을 입력으로 받습니다. 아래 표에 나와 있는 몇 가지 예시를 보여줍니다.
행 입력 | 열 입력 | 열 입력 | 열 입력 |
---|---|---|---|
44, 63, 72, 75, 80, 86, 87, 89 | 44 | 44, | 44,63,72 |
44 63 72 75 80 86 87 89 | 63 | 63, | 75,80 |
44,, 63,, 72, 75, 80, 86, 87, 89 | 72 | 72, | 86,87 |
44 63 72 75, 80, 86, 87, 89 | 75 | 75, | 89 |
44; 63; 72, 75,, 80, 86, 87, 89 | 80 | 80, | |
44,,, 63,, 72, 75, 80, 86, 87, 89 | 86 | 86, | |
44 63,, 72,,,, 75, 80, 86, 87, 89 | 87 | 87, | |
89 | 89, |
숫자들은 쉼표, 공백, 줄 바꿈 또는 하나 이상의 유형의 구분자 혼합으로 구분될 수 있습니다. 행 형식이나 열 형식을 사용할 수 있습니다. 위 표에 나타난 모든 형식에 대해, 계산기는 입력을 44, 63, 72, 75, 80, 86, 87, 그리고 89로 처리합니다.
데이터를 입력한 후, 그것이 샘플 데이터인지 모집단 데이터인지 선택할 수 있습니다. 계산 버튼을 누르면 계산기는 데이터 세트의 다섯 가지 통계 매개변수를 표시합니다: 관측치 수(count), 평균(mean), 제곱 편차의 합(sum of squared deviations), 분산(variance), 그리고 표준 편차(standard deviation).
이 계산기는 데이터 세트의 분산을 계산하기 위해 설계되었습니다. 또한 계산 뒤에 있는 이론에 대한 통찰력을 제공하고 관련된 모든 단계를 보여줍니다.
추론을 할 때, 좋은 통계를 얻기 위해 큰 데이터 세트를 사용하는 것이 바람직합니다. 하지만 가능한 모든 관측치를 대표하는 모집단 데이터를 얻기는 종종 어렵습니다. 따라서 일반적으로 규칙으로 모집단에서 "샘플"이 취해집니다. 그리고 모집단에 대한 결론은 보통 샘플 데이터로부터 도출됩니다.
분산은 데이터 세트의 평균에 대한 평균 분산을 측정합니다. 모집단에 대해서는 σ²로, 샘플에 대해서는 s²로 종종 표기됩니다. σ² 또는 s²의 더 큰 값은 샘플 평균에서 데이터 포인트의 더 큰 분산을 의미하고, 반대의 경우도 마찬가지입니다.
다음 예제 데이터 세트를 고려해보세요.
(세트 I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,
(세트 II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20
세트 I을 분산 계산기에 입력하면 다음과 같은 결과를 얻습니다:
n=11
x̄=16
SS=704
s²=70.4
s=8.39
샘플에 대해서, 그리고
n=11
μ=16
SS=704
σ²=64
σ=8
모집단에 대해서.
마찬가지로, 세트 II를 계산기에 입력하면 다음과 같은 결과를 얻습니다:
n=11
x̄=16
SS=56
s²=5.6
s=2.36
샘플에 대해서, 그리고
n=11
μ=16
SS=56
σ²=5.09
σ=2.25
모집단에 대해서.
s²=70.4
σ²=64
s²=5.6
σ²=5.09
통계에서 모집단은 실험에서 가능한 모든 관측치를 의미합니다. N개의 관측치에 대해 모집단 분산은 다음과 같습니다:
$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$
여기서
샘플 분산은 다음과 같이 정의됩니다:
$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$
여기서
분산을 계산하는 데에는 다음 단계들이 포함됩니다.
단계 1: 샘플/모집단 평균을 계산합니다. 이는 모든 데이터 포인트의 합을 데이터 포인트의 수(n은 샘플, N은 모집단)로 나눈 것입니다.
샘플 평균:
$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$
모집단 평균:
$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$
단계 2: 각 데이터 포인트에서 샘플/모집단 평균을 빼서 편차를 계산합니다.
샘플 편차:
$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$
모집단 편차:
$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$
단계 3: 각 데이터 포인트의 제곱 편차를 계산합니다.
샘플 제곱 편차:
$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$
모집단 제곱 편차:
$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$
단계 4: 제곱 편차의 합을 계산합니다.
샘플 제곱 편차의 합:
$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$
모집단 제곱 편차의 합:
$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$
단계 5: 샘플의 경우 n-1로, 모집단의 경우 N으로 제곱 편차의 합을 나누어 분산을 계산합니다.
샘플 분산:
$$s^2=\frac{SS}{n-1}$$
모집단 분산:
$$\sigma^2=\frac{SS}{N}$$
다음 데이터 세트를 고려해 보겠습니다: 1, 2, 4, 5, 6, 그리고 12. 샘플 분산을 계산하기 위해 다음 단계를 따릅니다:
단계 1: 샘플 평균(평균)을 계산합니다.
$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$
단계 2: 각 데이터 포인트의 평균에서의 편차를 계산합니다.
x₁-x̄ | x₂-x̄ | x₃-x̄ | x₄-x̄ | x₅-x̄ | x₆-x̄ |
---|---|---|---|---|---|
1 - 5 | 2 - 5 | 4 - 5 | 5 - 5 | 6 - 5 | 12 - 5 |
-4 | -3 | -1 | 0 | 1 | 7 |
단계 3: 편차의 제곱을 계산합니다.
(x₁-x̄)² | (x₂-x̄)² | (x₃-x̄)² | (x₄-x̄)² | (x₅-x̄)² | (x₆-x̄)² |
---|---|---|---|---|---|
16 | 9 | 1 | 0 | 1 | 49 |
단계 4: 제곱된 편차의 합을 계산합니다.
$$SS=\sum_{i=1}^{n}{(x_i-\bar{x})}^2=16+9+1+0+1+49=76$$
단계 5: 자유도(n-1)로 제곱된 편차의 합을 나누어 샘플 분산을 계산합니다.
$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15.2$$
모집단의 경우, 모집단 분산을 계산하기 위해 n-1 대신 n(데이터 포인트의 총 수)으로 나눕니다.
분산은 투자에 사용됩니다. 이는 자산 관리자가 그들의 투자 성과를 개선하는 데 도움을 줍니다. 금융 분석가들은 투자 포트폴리오의 구성 요소의 개별 성능을 평가하기 위해 분산을 사용할 수 있습니다.
투자자들은 새로운 구매를 고려할 때 투자가 위험을 감수할 가치가 있는지 결정하기 위해 분산을 계산합니다. 분산은 분석가들이 분산과 표준 편차 없이는 정량화하기 어려운 불확실성의 척도를 결정하는 데 도움을 줍니다.
불확실성은 직접 측정할 수 없습니다. 하지만 분산과 표준 편차(분산의 제곱근)는 특정 주식이 포트폴리오에 미치는 인식된 영향을 결정하는 데 도움을 줍니다.
과학자, 통계학자, 수학자 및 데이터 분석가들도 분산을 사용할 수 있습니다. 이는 실험 또는 샘플 인구에 대한 유용한 정보를 제공하는 데 도움을 줍니다.
과학자들은 실험 그룹 간의 차이를 살펴봄으로써 가설을 성공적으로 테스트할 수 있는지 여부를 결정할 수 있습니다. 데이터 세트의 분산이 높을수록 데이터 세트 내의 값이 더 흩어집니다. 데이터 연구자들은 이 정보를 사용하여 평균이 데이터 세트를 얼마나 잘 대표하는지 볼 수 있습니다.
분산을 사용하는 단점은 세트 내 큰 이상치가 데이터의 일부 왜곡을 초래할 수 있다는 것입니다. 이는 제곱되면 이상치가 그 무게를 더욱 증가시킬 수 있기 때문입니다.
많은 연구자들은 분산의 제곱근으로 계산되는 표준 편차를 사용하는 것을 선호합니다. 표준 편차는 이상치의 영향을 덜 받으며, 더 작은 수치이며 해석하기 쉽습니다.