Calculadora de desvio padrão
O que é uma calculadora de desvio padrão?
Uma calculadora de desvio padrão mede o quanto um conjunto de números está disperso em torno da sua média. Insira seus dados e a calculadora informa instantaneamente a contagem, a média, a variância e o desvio padrão, tanto para a interpretação populacional quanto para a amostral dos seus dados. Um desvio padrão pequeno significa que os valores se agrupam de forma compacta em torno da média; um grande significa que estão amplamente espalhados.
O desvio padrão é uma das medidas de dispersão mais usadas na estatística. Ele aparece em toda parte, do controle de qualidade e das finanças (onde é frequentemente chamado de volatilidade) à análise de notas de provas e à pesquisa científica, porque expressa a variabilidade nas mesmas unidades dos dados originais.
População versus amostra
Há duas versões intimamente relacionadas de variância e desvio padrão, e escolher a correta importa.
- As estatísticas populacionais descrevem um conjunto de dados completo: cada membro que lhe interessa está incluído. A variância populacional divide a soma dos desvios ao quadrado pela contagem , e seus símbolos são (variância) e (desvio padrão).
- As estatísticas amostrais descrevem um subconjunto menor extraído de uma população maior, e você quer estimar a dispersão de toda essa população a partir da amostra. A variância amostral divide por em vez de por (isso é conhecido como correção de Bessel), o que corrige o viés que surge ao usar a média amostral em vez da verdadeira média desconhecida. Seus símbolos são (variância) e (desvio padrão).
Como dividir pelo menor produz um resultado ligeiramente maior, o desvio padrão amostral é sempre maior ou igual ao desvio padrão populacional para os mesmos dados. A versão amostral requer pelo menos dois dados; com um único valor não há dispersão a estimar.
Como funciona?
O desvio padrão populacional é a raiz quadrada da distância média ao quadrado de cada valor em relação à média:
onde é a média populacional e é o número de valores. O desvio padrão amostral usa a média amostral e divide por :
O cálculo segue quatro passos:
- Encontre a média somando todos os valores e dividindo pela quantidade deles.
- Encontre cada desvio subtraindo a média de cada valor.
- Eleve ao quadrado cada desvio e some os quadrados.
- Divida por (população) ou (amostra) e, em seguida, extraia a raiz quadrada para obter o desvio padrão. Omitir a raiz quadrada deixa você com a variância.
Exemplo resolvido
Considere o conjunto de dados , que tem valores.
Primeiro, a média:
Em seguida, os desvios ao quadrado em relação à média de são , que somam . A variância e o desvio padrão populacionais são:
Tratando os mesmos números como uma amostra, divida a soma dos quadrados por :
Como esperado, o desvio padrão amostral é maior que o desvio padrão populacional .
Para um conjunto menor como , a média é , a soma dos desvios ao quadrado é , o desvio padrão populacional é e o desvio padrão amostral é .
Notas práticas
Use a fórmula populacional quando seus números representam todo o grupo que você está analisando — por exemplo, as notas de prova de cada aluno de uma única turma quando essa turma é tudo o que lhe interessa. Use a fórmula amostral quando seus números são um subconjunto usado para inferir algo sobre um grupo maior, o caso comum em pesquisas, experimentos e na maioria das estatísticas do mundo real.
O desvio padrão combina naturalmente com a média e com estimativas por intervalo, como o intervalo de confiança, que usa o desvio padrão e o tamanho da amostra para delimitar a verdadeira média. Ele também fundamenta os valores críticos usados em testes de hipóteses.
Perguntas frequentes
Qual é a diferença entre variância e desvio padrão?
A variância é a média dos desvios ao quadrado em relação à média, expressa em unidades ao quadrado. O desvio padrão é a raiz quadrada da variância, que devolve a medida às unidades originais dos dados e a torna mais fácil de interpretar.
Devo usar o desvio padrão populacional ou amostral?
Use a versão populacional (, dividir por ) quando seus dados abrangem todo o grupo de interesse. Use a versão amostral (, dividir por ) quando seus dados são uma amostra de uma população maior e você deseja uma estimativa não enviesada da dispersão dessa população.
O desvio padrão pode ser zero ou negativo?
Ele pode ser zero, o que ocorre apenas quando todos os valores do conjunto de dados são idênticos — não há dispersão. Ele nunca pode ser negativo, porque é a raiz quadrada de uma soma de termos ao quadrado (não negativos).