Correlaciones
Al poner en práctica la IA y el aprendizaje automático, es común explorar las correlaciones entre las variables. En estadística, una correlación es una asociación matemática entre dos variables. Cuando las variables se correlacionan, se sugiere que cada variable tiene algún tipo de efecto sobre la otra. La naturaleza de este efecto puede variar, pero todas las correlaciones revelan al menos alguna relación entre las variables. Muchos enfoques del análisis de los datos e incluso de los algoritmos de aprendizaje automático buscan correlaciones entre los valores de los datos. Correlaciones como estas pueden mejorar el poder predictivo y de toma de decisiones tanto del profesional como de los modelos que ellos construyen.
Por ejemplo, supongamos que está desarrollando un modelo estadístico para predecir el aumento y la caída de las poblaciones de las ciudades a lo largo del tiempo. Es posible que observe que existe una correlación entre la disponibilidad de empleo y la población total. En promedio, más empleos disponibles podrían significar una mayor población. Por supuesto, la correlación puede no ser perfecta. Una ciudad con un índice de disponibilidad de empleo elevado podría tener una población más pequeña que una ciudad con un índice de disponibilidad de empleo más bajo. Pero, en general, si descubre que las ciudades con mayor disponibilidad de empleo tienden a tener poblaciones más grandes, podría decirse que hay una correlación positiva entre las variables job_availability
y total_population
. Por lo tanto, el modelo podría hacer un mejor trabajo al predecir la población futura de una ciudad en función de su índice de disponibilidad de empleo.
Es importante tener en cuenta que las correlaciones pueden o no ser causales. En otras palabras, el cambio en una variable puede o no ser la causa directa de un cambio en otra variable. Otras variables o incluso otros factores pueden afectar las variables que esté estudiando. O bien, la causa y el efecto pueden ser lo contrario de lo que piensa. Considere el ejemplo de la población de las ciudades. ¿Un aumento en la disponibilidad del empleo realmente implica una población más grande, o una población más grande implica el crecimiento de la industria, que a su vez implica más puestos de trabajo disponibles? Al analizar los datos en busca de correlaciones, es una buena idea ejercer el pensamiento crítico y evitar sacar conclusiones precipitadas sobre el poder de una variable para cambiar otra.