Ir al contenido principal

Diagrama de temas

    • Normalización y Estandarización

      Normalización y estandarización

      La normalización implica transformar una característica de forma que el valor más bajo sea un 0 y el valor más alto sea un 1. Por lo tanto, cualquier vehículo que tenga menos millas recorridas tendrá un 0 en lugar de cualquiera que sea el verdadero valor. Y, el vehículo con más millas recorridas tendrá un 1 en lugar del valor real. El mismo principio exacto se aplica también a la edad del vehículo y a cualquier otra característica numérica que usted crea que necesita ser escalada. Ahora el algoritmo de aprendizaje automático verá la distribución de estas características en lugar de los valores absolutos.

      La estandarización también proporciona escalado, pero lo hace de una manera diferente. Calcula la puntuación z de un valor (también llamada puntuación estándar) como el número de desviaciones estándar en que la muestra está por encima o por debajo de la media de todos sus valores. Puede obtener la puntuación z de las millas recorridas de cualquier vehículo, la antigüedad, etc. Estas puntuaciones se estandarizan para que cada característica tenga un valor medio de cero y una desviación estándar tenga un valor medio de 1. Una vez más, esto enfatiza la distribución de la característica en lugar de su escala absoluta.

      Un enfoque no es necesariamente mejor que el otro en todos los casos. La normalización tiende a ser útil cuando los datos sin procesar no siguen una distribución normal y usted desea usar los datos con un algoritmo que no suponga ningún tipo particular de distribución. Además es bueno para minimizar el efecto de los valores atípicos. Dado que la estandarización no tiene límites superiores o inferiores, no minimiza los valores atípicos de la misma manera. A menudo es útil para cuando los datos sin procesar ya están distribuidos normalmente y solo desea asegurarse de que dos características estén en la misma escala. Aun así, por lo general es mejor experimentar con ambos para determinar qué es lo mejor para una situación determinada.

      Información adicional 

      Para obtener más información sobre la normalización en contraposición a la estandarización, consulte este sitio.