Análisis de la distribución de datos
Antes de empezar
Analyzing Data.ipynb está abierto en Jupyter Notebook.
Nota: Si cerró Jupyter Notebook desde que completó la actividad anterior, deberá reiniciar Jupyter Notebook y volver a abrir el archivo. Para asegurarse de que todos los objetos y la salida de Python están en el estado correcto para comenzar esta actividad:
1. Seleccione Kernel→Reiniciar & y Borrar salida.
2. Seleccione Reiniciar y borrar todas las salidas.
3. Desplácese hacia abajo y seleccione la celda con la etiqueta Examinar estadísticas descriptivas.
4. Seleccione Celda→ Ejecutar todo lo anterior.
Escenario
Exploró la estructura general del conjunto de datos y se familiarizó con las distintas columnas de datos, incluido el tipo de datos de cada columna. Ahora examinará algunas medidas estadísticas a medida que continúe pensando qué características pueden ser útiles para predecir el precio óptimo de una casa.
1. Ver estadísticas descriptivas para el conjunto de datos.
1. Desplácese hacia abajo para ver la celda titulada Examinar estadísticas descriptivas y examine la lista de código debajo de ella.
Este código generará una descripción estadística de los datos contenidos en houses_data.
2. Ejecute la celda de código.
3 Examine las estadísticas que describen el conjunto de datos.
El hogar promedio (medio) en este conjunto de datos tiene un precio de $540.173,46; 3,37 dormitorios, 2,11 baños, 2079,90 pies cuadrados de espacio habitable y 1,49 pisos.
-------------------------------------------------------------------------------------------------------------------------------------------------------------
2. Resuma el modo para los valores de datos no continuos o categóricos.
1. Desplácese hacia abajo para ver la celda titulada Resumir los valores más comunes y examine la lista de código debajo de ella.
Este código muestra el modo (valor de datos más común) para las características seleccionadas.
2. Ejecute la celda de código.
3. Examine los valores de modo que se muestran para las distintas características.
- No tiene una "vista" y no está en la costa.
- Tiene una clasificación de 7.
- Tiene un código postal de 98103.
- Tiene 3 dormitorios, 2,5 baños, 1 planta y un techo de asfalto.