Ir al contenido principal

Diagrama de temas

    • Agregación de Datos

      Agregación de datos


      La agregación de datos es el proceso en el que se resumen los datos de algún tipo. Normalmente, esto hace para realizar análisis estadísticos en datos y como parte de la extracción de datos para proyectos de IA y AA, ya que la mayoría de los algoritmos de IA y AA se basan en el análisis estadístico. Por ejemplo, si deseara saber el precio promedio de una vivienda en el área de Seattle en el último año, agregaría todos los precios de venta de viviendas sumándolos y luego dividiéndolos por el número de viviendas vendidas.

      Es común agregar datos de tabla a medida que ingresan en la fase de extracción. De este modo, puede asegurarse de que los datos están en un formato que es más fácil de interpretar o un formato que es más coherente con otros orígenes de datos que utiliza. Cuando se trabaja con bases de datos estructuradas mediante comandos SQL, se hace mediante la palabra clave GROUP BY, emparejadas con una función de agregación como COUNTSUMAVG, etc. Por ejemplo, supongamos que tiene una columna llamada sale_price en la base de datos real_estate y desea devolver una tabla que enumere cada vecindario y el precio de venta promedio de las viviendas en ese vecindario. Podría escribir:

      SELECT neighborhood , AVG(sale_price) AS avg_price FROM real_estate GROUP BY neighborhood


      Figura 1. Ejemplo de consulta SQL: agregar datos mediante una función.