Ir al contenido principal

Diagrama de temas

    • Desviación Estándar

      Desviación estándar


      Puede preguntarse por qué la varianza comúnmente se muestra como sigma al cuadrado (σ2). El símbolo σ representa la desviación estándar, una medida diferente de la variabilidad que está estrechamente relacionada con la varianza. De hecho, la desviación estándar es simplemente la raíz cuadrada de la varianza. Estas dos medidas de variabilidad se utilizan para fines diferentes.

      La varianza se calcula cuadrando las diferencias entre cada valor y la media. Debido a esta operación de cuadratura, la medida resultante de la variabilidad puede terminar siendo mucho mayor que los valores reales en el conjunto de datos. Si bien la medida resultante es bastante útil para las operaciones matemáticas, no es intuitiva para las personas que intentan hacerse una idea de la cantidad promedio de desviación en relación con los valores de datos reales.

      La desviación estándar invierte la operación de cuadratura para expresar la medida de la variabilidad en la misma escala que los valores de datos reales. Esto es útil, ya que otras medidas descriptivas, como la media, la mediana, el modo, el mínimo y el máximo, se ubican en la misma escala que los datos en sí. Por lo tanto, la desviación estándar se utiliza a menudo para fines de explicación o presentación de informes. Es fácil que las personas entiendan la cantidad de desviación en relación con la escala de los valores reales.

      La fórmula de desviación estándar para toda una población se expresa como:

      Donde:
      σ representa la desviación estándar de una población, que es lo que se está intentando calcular en este caso.
      Σ es el operador de suma, que significa "adicionar los siguientes números".
      X es la cantidad medida en los datos de una columna, como el salario del empleo por persona o la edad de cada persona.
      μ es la media, el promedio de todos los valores del conjunto.
      N es el número de valores incluidos en el conjunto.

      Si ya ha calculado la varianza, puede obtener la desviación estándar simplemente realizando el cálculo de la raíz cuadrada de dicha varianza.

      Tenga en cuenta que no necesariamente se pueden comparar las desviaciones estándar de diferentes poblaciones. Por ejemplo, la desviación estándar de las puntuaciones de los estudiantes en un examen podría ser algo pequeño, como 10. La desviación estándar de los precios de la vivienda en la parte más rica del país va a ser algo mucho mayor, probablemente más de 1.000.000. Eso no significa que los precios de la vivienda estén mucho más repartidos que los resultados de los exámenes; los conjuntos de datos son simplemente en diferentes escalas. Es más útil identificar las desviaciones estándar como "bajas" o "altas" cuando se comparan entre muestras de una única población, como mostraremos en breve.