Ir al contenido principal

Diagrama de temas

    • Estructura de los Datos

       Estructura de los datos


      Los conjuntos de datos pueden estar estructurados o no estructurados. Los datos estructurados están en un formato que facilita la búsqueda, el filtrado o la extracción, como una hoja de cálculo o una base de datos, en la que las categorías de dichos datos están separadas o etiquetadas. Puede recuperar fácilmente fragmentos específicos de datos (como la altura, la edad, el nombre o el apellido) para cualquier registro mediante código de programación o un lenguaje de consulta como el lenguaje de consulta estructurado (SQL). Los datos estructurados suelen presentar la forma de una base de datos relacional, en la que los datos se organizan en columnas y filas de una tabla, y los elementos de esa tabla presentan alguna relación existente.

      Los datos no estructurados, por otro lado, no son tan fáciles de consultar. Los ejemplos incluyen cosas como imágenes, archivos de video o audio, datos publicados en sitios de redes sociales, el contenido de documentos de correo electrónico, etc. La información en estos tipos de formatos no se registra necesariamente en contenedores ordenados y predefinidos como lo haría en una hoja de cálculo o base de datos. No obstante, los datos no estructurados suelen ser una fuente importante de información en los proyectos de IA y AA, y a menudo representan una porción mucho mayor de los datos utilizados que los datos estructurados.

      Algunos datos pueden considerarse semiestructurados. Por ejemplo, aunque el contenido de los datos de correo electrónico puede no estar estructurado, los documentos de correo electrónico, en sí, contienen alguna estructura. Los campos asociados con el remitente, el destinatario, la fecha de envío, etc., proporcionan datos estructurados que puede buscar, filtrar y extraer directamente.