Calculadoras de Estatísticas
Calculadora de Desvio Padrão


Calculadora de Desvio Padrão

Dado um conjunto de dados discreto, a calculadora calcula a média, a variância e o desvio padrão de uma amostra ou população e mostra todas as etapas intermediárias dos cálculos.

Resultado
Desvio Padrão s = 4.5
Variância s2 = 20.24
Contagem n = 7
Média x̄ = 14.29
Soma dos Quadrados SS = 100

Houve um erro com seu cálculo.

Índice

  1. Desvio padrão como medida estatística
  2. As regras para o uso desta calculadora
  3. Os problemas que esta calculadora foi projetada para resolver
  4. Fórmulas para calcular o desvio padrão
  5. Cálculo de desvio padrão
  6. Exemplo de cálculo de desvio padrão de uma amostra
  7. Aplicações do Desvio Padrão

Calculadora de Desvio Padrão

Desvio padrão como medida estatística

O desvio padrão é uma das métricas mais usadas para caracterizar as estatísticas de um determinado conjunto de dados. O desvio padrão, em termos simples, é uma medida de como o conjunto de dados está disperso. Ao calcular o desvio padrão, você pode descobrir se os números estão próximos ou distantes da média. Se os pontos de dados estiverem longe da média, então há um grande desvio no conjunto de dados. Portanto, quanto maior for a dispersão nos dados, maior será o desvio padrão.

Esta calculadora define o desvio padrão de um determinado conjunto de dados e exibe as etapas matemáticas envolvidas no cálculo.

As regras para o uso desta calculadora

A calculadora aceita a entrada como uma lista de números separados por um delimitador. Alguns exemplos de possíveis entradas são mostrados na tabela abaixo.

entrada de linhas entrada de coluna entrada de coluna entrada de coluna
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

Os números podem ser separados por uma vírgula/espaço/ quebra de linha ou uma mistura deles e podem ser inseridos no formato de linha ou coluna. Para todos os formatos mostrados na tabela acima, a calculadora processa a entrada como 44, 63, 72, 75, 80, 86, 87, e 89.

Uma vez inseridos os dados, selecione se se trata de uma amostra ou dados populacionais e pressione enter. A calculadora exibe cinco parâmetros estatísticos do conjunto de dados: contagem (número de observações), média, soma dos desvios quadráticos, variância e desvio padrão.

Os problemas que esta calculadora foi projetada para resolver

A calculadora é projetada para calcular o desvio padrão de um conjunto de dados discreto e fornece uma visão da teoria por trás do cálculo.

Os dados podem consistir em uma população composta de todas as observações possíveis em um experimento (de qualquer tipo) sob as condições especificadas. Em muitos casos, é impossível amostrar cada membro da população.

Na prática estatística, é comum trabalhar com um subconjunto de uma "população" maior, que chamamos de "amostra". Isso ocorre porque muitas vezes é impraticável ou impossível coletar dados de todos os indivíduos da população. Fazemos estimativas ou inferências sobre a população com base nas informações coletadas da amostra.

Ao calcular o desvio padrão, a fórmula que usamos é ajustada dependendo do fato de estarmos lidando com uma amostra ou com a população inteira. Esse ajuste é feito por meio de um fator conhecido como "graus de liberdade". Para uma amostra, dividimos por n - 1 (onde n é o tamanho da amostra) em vez de n ao calcular a variação, que é então elevada ao quadrado para encontrar o desvio padrão. Essa correção compensa o fato de estarmos usando dados de amostra para estimar o desvio padrão da população e garante que nossa estimativa não seja tendenciosa.

O desvio padrão mede a dispersão/desvio médio/variabilidade de um conjunto de dados em relação à média. É frequentemente indicado pela letra grega σ para uma população ou s para uma amostra. Um valor maior de σ ou s implica uma dispersão maior de pontos de dados a partir da média da amostra e vice-versa.

Considere os seguintes exemplos de conjuntos de dados.

(Conjunto I)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

( Conjunto II)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

Substituindo esses conjuntos de dados na calculadora, obtemos para o conjunto I

  • x̄=16 - o valor médio
  • s=8,3904708 - desvio padrão

Para o conjunto II

  • x̄=16 - o valor médio
  • s=2,3664319 - desvio padrão

No Conjunto I, os números desviaram-se significativamente da média da amostra (s=8,39), enquanto no Conjunto II a variabilidade é pequena (s=2,36) em comparação com o Conjunto I.

Fórmulas para calcular o desvio padrão

Esta fórmula é aplicada quando todos os valores da população são analisados.

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ é o desvio padrão da população,
  • xᵢ é o valor de um valor individual da população,
  • μ é a média aritmética da população,
  • n é o tamanho da população.

A fórmula abaixo é usada quando há um tamanho muito grande de população e apenas sua amostra é retirada para análise.

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s é o desvio padrão da amostra,
  • xᵢ é o valor de um valor de amostra individual,
  • é o meio da amostra,
  • n é o tamanho da amostra.

Cálculo de desvio padrão

Os seguintes passos estão envolvidos no cálculo do desvio padrão.

Passo 1: Calcular a média da amostra/população. É a soma de todos os pontos de dados dividida pelo número de contagens N ou n, ou seja:

Média da amostra:

$$\bar{x}=\frac{x₁+x₂+x_3+........+x_n}{n}$$

Média da população

$$\mu=\frac{x₁+x₂+x_3+........+x_N}{N}$$

Passo 2: Calcular os desvios, subtraindo a média amostral/população de cada ponto de dados, ou seja

Desvios de amostra:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x_3-\bar{x})…………………… (x_n-\bar{x})$$

Desvios da população:

$$(x₁-\ \mu), (x₂-\ \mu), (x_3-\ \mu)……………….. (x_N-\ \mu)$$

Passo 3: Calcular os desvios ao quadrado para cada ponto de dados.

Amostra dos desvios ao quadrado:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x_3-\bar{x})^2…………………… (x_n-\bar{x})^2$$

Desvios da população ao quadrado:

$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (x_3-\ \mu)^2……………….. (x_N-\ \mu)^2$$

Passo 4: Calcular a soma dos desvios ao quadrado adicionando todos os desvios individuais ao quadrado

Amostra da soma dos desvios ao quadrado:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x_3-\bar{x})^2……………………+(x_n-\bar{x})^2$$

Soma dos desvios ao quadrado da população:

$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(x_3-\ \mu)^2……………….+ (x_N-\ \mu)^2$$

Etapa 5: Divida a soma dos desvios ao quadrado pelo número de graus de liberdade para obter a variação. Para uma população, divida por N, e para uma amostra, divida por n-1.

Variância da amostra

$$ s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1} $$

Variância da população

$$ \sigma^2 = \frac{\sum_{i=1}^{N}(xᵢ - \mu)^2}{N} $$

Ao calcular a variação para uma amostra, podemos supor que usaremos a expressão para os cálculos:

$$\frac{(x-\bar{x})^2}{n}$$

onde

x̄ é a média da amostra e n é o tamanho da amostra. Mas tal fórmula não é utilizada.

Tal expressão não daria uma boa estimativa da variância da população. Quando a população geral é muito grande e a amostra é muito pequena, a variância calculada por esta fórmula subestimaria a variância da população. Isto mostraria uma variância muito pequena devido à falta de dados. Assim, usando a expressão n-1, aumentamos o valor da variância potencial.

Ao invés de dividir por n, encontramos a variância da amostra dividindo por n-1. Esta operação dá um valor de variância um pouco maior, mais próximo do valor real.

Passo 6: Extrair a raiz quadrada do número resultante. O desvio padrão é a raiz quadrada da variância.

Desvio padrão da amostra

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$

Desvio padrão da população

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$

Exemplo de cálculo de desvio padrão de uma amostra

Vamos considerar as seguintes notas de n=8 alunos na prova de Física:

45, 67, 70, 75, 80, 81, 82 e 84

A calculadora calcula o desvio padrão da amostra usando os seguintes passos:

Passo 1: Calcular a média.

$$\bar{x}=\frac{\sum_{i} x_i}{n}=\frac{45+\ 67+\ 70+\ 75+\ 80+\ 81+\ 82+\ 84}{8}=73$$

Passo 2: Calcular os desvios

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

Passo 3: Calcular os quadrados de desvios

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

Passo 4: Somar os desvios ao quadrado.

$$SS=\sum_{i}^{n}{{(x_i-\ \bar{x})}^2=784+36+9+4+49+64+81+121}=1148$$

Passo 5: Calcular a variação dividindo a soma dos desvios quadráticos por graus de liberdade (n-1). Para uma população, a variância nesta etapa seria dividida por N e não por N-1. Neste caso, temos uma amostra, ou seja, dados sobre uma porção da população estudantil, não a população inteira.

$$s^2=\ \frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}=\frac{1148}{8-1}=164$$

Passo 6: Pegar a raiz quadrada da variância para obter o desvio padrão.

$$s=\sqrt{s^2}=\ \sqrt{164}=12.80$$

Aplicações do Desvio Padrão

A dispersão e o desvio padrão podem ser usados para determinar a dispersão dos dados. Se a variação ou desvio padrão for grande, os dados estarão mais dispersos. Esta informação é útil ao comparar dois (ou mais) conjuntos de dados para determinar qual é mais (a maioria) variável.

Na indústria, o desvio padrão é amplamente utilizado para o controle de qualidade. Na produção em larga escala, certas características do produto devem estar dentro de uma faixa definida que pode ser acessada através do cálculo do desvio padrão. Por exemplo, na produção de porcas e parafusos, a variação em seus diâmetros deve ser pequena, caso contrário, as peças não se encaixarão juntas.

Um desvio padrão é usado em finanças e em muitas outras áreas para avaliar o risco. Na análise técnica, o desvio padrão é usado para construir análises de Bollinger e calcular a volatilidade.

Além disso, o desvio padrão é usado em finanças como medida de volatilidade, e em sociologia, é usado em pesquisas de opinião pública para ajudar a calcular a incerteza.

A variância e o desvio padrão são usados para determinar o número de valores de dados que se enquadram em um determinado intervalo de distribuição. Por exemplo, a desigualdade de Chebyshev mostra que, para qualquer distribuição, pelo menos 75% dos valores dos dados estarão dentro de 2 desvios padrão da média.

Vamos dar um exemplo simples com o clima. Suponhamos que estudemos a temperatura diária de duas cidades na mesma região. Uma cidade está na costa e a outra no interior. A temperatura máxima diária média nessas duas cidades pode ser a mesma. Mas o desvio padrão, ou seja, a propagação das temperaturas máximas diárias será maior para a cidade localizada no continente, e a cidade costeira terá um desvio padrão menor das temperaturas máximas diárias.

Isto significa que uma cidade continental terá uma variação maior na temperatura máxima do ar em qualquer dia do ano do que uma cidade costeira. Ou seja, a cidade costeira terá um clima mais ameno.