Ir al contenido principal

Diagrama de temas

    • Varianza


      La varianza de una población: mide la distancia en la que se aleja cada valor del conjunto de datos de la media.

      La fórmula para la varianza en una población se expresa como:


      Donde:

      σ2 representa la varianza de una población, que es lo que intenta calcular en este caso.
      Σ es el operador de suma, que significa "adicionar los siguientes números".
      X es la cantidad medida en los datos de una columna, como el salario del empleo por persona o la edad de cada persona.
      μ es la media, el promedio de todos los valores en la población.
      N es el número de valores incluidos en el conjunto.

      Nota: Puede utilizar las funciones del software para realizar este y otros cálculos que se describen en este curso. Sin embargo, comprender cómo se realiza el cálculo lo ayudará a entender lo que se mide, por lo que se proporciona aquí para su referencia.

      Nota: Σ es la letra griega mayúscula sigma, σ es la versión en minúsculas de sigma (también llamada "pequeña sigma") y μ es la letra griega mu (que se pronuncia miu).

      La varianza se calcula en una columna de datos mediante:
      La búsqueda de la media (promedio) de todos los valores en el conjunto.
      Para cada número del conjunto, restando la media y luego calculando el cuadrado de la diferencia.
      Sumando todos los valores calculados en el paso 2 y dividiendo el resultado por el número de valores en el conjunto para obtener el promedio.

      En el paso 2, calcular el cuadrado de la diferencia tiene dos beneficios: Otorga más peso a los valores más alejados de la media. También garantiza que los números menores que la media (que arrojan un valor negativo cuando se restan) no cancelarán a los números mayores que la media (diferencias positivas). Los valores que son menores o mayores que la media tendrán una influencia positiva en la medición de la varianza.