Evaluación del tipo de datos
Cuando se discuten los tipos de datos, realmente puede estar refiriéndose a una de dos cosas: los tipos de características de alto nivel o los tipos de datos legibles por máquina. El primero se refiere a la forma general en que los valores de datos representan una o más observaciones. Esto tiene un impacto significativo en cómo se puede trabajar con esos datos, incluida la forma en que se preparan, cómo se analizan y cómo se modelan. Hay tres tipos principales de características:
- Los datos cuantitativos (o numéricos) contienen valores numéricos que expresan magnitud. Por ejemplo, una característica Price
tiene una magnitud porque está midiendo cuánto hay de algo.
- Los datos cualitativos (o categóricos) contienen un valor de un conjunto de valores que normalmente son limitados. Por ejemplo, la característica Color
de un automóvil puede contener valores como rojo, azul y negro. Tenga en cuenta que no hay una clasificación inherente en los datos categóricos: ningún color es "mejor" que los demás en este ejemplo.
- Los datos ordinales no son del todo categóricos porque se pueden ordenar. Pero tampoco son del todo cuantitativos porque no miden la magnitud. Por ejemplo, una característica Grade
puede contener la calificación de un alumno, que puede ser A, B, C, D o F. Se representa un rango u orden inherente (por ejemplo, una A es una mejor calificación que una C).
Por otro lado, los tipos de datos, también llamados formatos de datos, además se refieren a las formas en que los lenguajes de programación representan los datos para su ejecución por hardware informático. Estos tipos de datos tienen un impacto directo en la forma en que un programa interpreta los datos. Entre los ejemplos de los tipos de datos con los que podría estar familiarizado se incluyen:
- Enteros, como 25
.
- Flotadores, como 12.78
.
- Cadenas, como 'Red'
.
- Booleanos, como True
o False
.
- Fechas y horas, como 2021-03-01
.
Es importante comprender estas diferencias, ya que las características y los tipos de datos no siempre se asignan uno a uno. Por ejemplo, no todos los datos categóricos se representan mediante una cadena. La característica
Home Sold
podría contener el entero
1
en lugar de la cadena
'Yes'
y el entero
0
en lugar de la cadena
'No'
.