Calculadora de desviación estándar
¿Qué es una calculadora de desviación estándar?
Una calculadora de desviación estándar mide cuán dispersos están un conjunto de números en torno a su media. Introduce tus datos y la calculadora informa al instante el recuento, la media, la varianza y la desviación estándar, tanto para la interpretación poblacional como muestral de tus datos. Una desviación estándar pequeña significa que los valores se agrupan estrechamente alrededor del promedio; una grande significa que están ampliamente dispersos.
La desviación estándar es una de las medidas de dispersión más utilizadas en estadística. Aparece en todas partes, desde el control de calidad y las finanzas (donde a menudo se denomina volatilidad) hasta el análisis de calificaciones de exámenes y la investigación científica, porque expresa la variabilidad en las mismas unidades que los datos originales.
Población frente a muestra
Hay dos versiones estrechamente relacionadas de la varianza y la desviación estándar, y elegir la correcta importa.
- Los estadísticos de población describen un conjunto de datos completo: se incluye cada miembro que te interesa. La varianza poblacional divide la suma de las desviaciones al cuadrado por el recuento , y sus símbolos son (varianza) y (desviación estándar).
- Los estadísticos de muestra describen un subconjunto más pequeño extraído de una población mayor, y quieres estimar la dispersión de toda esa población a partir de la muestra. La varianza muestral divide por en lugar de por (esto se conoce como corrección de Bessel), lo que corrige el sesgo que surge al usar la media muestral en vez de la verdadera media desconocida. Sus símbolos son (varianza) y (desviación estándar).
Como dividir por el menor produce un resultado ligeramente mayor, la desviación estándar muestral es siempre mayor o igual que la desviación estándar poblacional para los mismos datos. La versión muestral requiere al menos dos datos; con un solo valor no hay dispersión que estimar.
¿Cómo funciona?
La desviación estándar poblacional es la raíz cuadrada de la distancia media al cuadrado de cada valor respecto a la media:
donde es la media poblacional y es el número de valores. La desviación estándar muestral usa la media muestral y divide por :
El cálculo sigue cuatro pasos:
- Halla la media sumando todos los valores y dividiendo por cuántos hay.
- Halla cada desviación restando la media de cada valor.
- Eleva al cuadrado cada desviación y suma los cuadrados.
- Divide por (población) o (muestra), y luego toma la raíz cuadrada para obtener la desviación estándar. Omitir la raíz cuadrada te deja con la varianza.
Ejemplo resuelto
Considera el conjunto de datos , que tiene valores.
Primero, la media:
A continuación, las desviaciones al cuadrado respecto a la media de son , que suman . La varianza y la desviación estándar poblacionales son:
Tratando los mismos números como una muestra, divide la suma de cuadrados por :
Como era de esperar, la desviación estándar muestral es mayor que la desviación estándar poblacional .
Para un conjunto más pequeño como , la media es , la suma de las desviaciones al cuadrado es , la desviación estándar poblacional es y la desviación estándar muestral es .
Notas prácticas
Usa la fórmula poblacional cuando tus números representan todo el grupo que estás analizando; por ejemplo, las calificaciones de cada estudiante de una única clase cuando esa clase es lo único que te interesa. Usa la fórmula muestral cuando tus números son un subconjunto que se usa para inferir algo sobre un grupo mayor, que es el caso habitual en encuestas, experimentos y la mayoría de las estadísticas del mundo real.
La desviación estándar se combina de forma natural con la media y con estimaciones por intervalos como el intervalo de confianza, que usa la desviación estándar y el tamaño de la muestra para acotar la verdadera media. También subyace a los valores críticos que se usan en las pruebas de hipótesis.
Preguntas frecuentes
¿Cuál es la diferencia entre varianza y desviación estándar?
La varianza es el promedio de las desviaciones al cuadrado respecto a la media, expresado en unidades al cuadrado. La desviación estándar es la raíz cuadrada de la varianza, que devuelve la medida a las unidades originales de los datos y la hace más fácil de interpretar.
¿Debo usar la desviación estándar poblacional o la muestral?
Usa la versión poblacional (, dividir por ) cuando tus datos cubren todo el grupo de interés. Usa la versión muestral (, dividir por ) cuando tus datos son una muestra de una población mayor y quieres una estimación insesgada de la dispersión de esa población.
¿Puede la desviación estándar ser cero o negativa?
Puede ser cero, lo que ocurre únicamente cuando todos los valores del conjunto de datos son idénticos: no hay dispersión. Nunca puede ser negativa, porque es la raíz cuadrada de una suma de términos al cuadrado (no negativos).