Ir al contenido principal

Diagrama de temas

    • Fuentes de los Datos

      Origen de los datos

      Se utilizan varios términos para referirse a los distintos tipos de repositorios donde se recopilan los datos. Si bien estos términos están destinados a representar diferentes conceptos, a veces se usan indistintamente.

      Repositorio de datos Descripción
      Lago de datos
      - Propósito: aprendizaje automático, análisis de big data, análisis predictivo (uso de estadísticas para realizar predicciones sobre eventos futuros) y descubrimiento de datos (extracción de información útil de grandes conjuntos de datos). Los datos pueden utilizarse en cualquier momento o nunca. Es posible que aún no exista un propósito específico para conservar los datos, pero se conserva para posibles necesidades futuras.
      - Fuente: datos estructurados y no estructurados de muchas fuentes, como dispositivos inteligentes, sitios web, aplicaciones, registros de servidores, etc.
      - Estructura: muy variable. Por lo general, los datos se mantienen en sus formas originales, que pueden incluir tipos de datos no tradicionales, como registros de servidores web, datos de sensores, actividad de redes sociales, texto e imágenes. Consumir y almacenar datos como este puede ser costoso y difícil.
      Almacén de datos operativos
      - Propósito: recopila, agrega y prepara datos para su uso en operaciones. Puede alimentar a un almacén de datos.
      - Fuentedatos transaccionales (datos sobre eventos que incluyen algún tipo de intercambio, como la compra de un producto) capturados de varias aplicaciones y otras fuentes.
      - Estructura: los datos se han estructurado para un acceso rápido y fácil, pero pueden requerir una preparación adicional antes de que se puedan transferir a un almacén de datos.
      Almacén de datos
      - Propósito: análisis de datos para información, informes por lotes y visualización de datos (traducción de datos en gráficos, tablas y otros objetos visuales).
      - Fuente: datos relacionales capturados de múltiples fuentes relacionales, incluidas aplicaciones, sistemas transaccionales y bases de datos de operaciones, generalmente dentro de una única organización, como una empresa, una agencia gubernamental, una universidad o un sistema de atención médica.
      - Estructura: los datos se han estructurado para obtener un acceso rápido y fácil.
      Data mart
      - Propósito: datos utilizados para apoyar un tipo particular de análisis.
      - Fuente: una subsección del almacén de datos, que aloja datos destinados específicamente a admitir un tipo particular de análisis o abordar un requisito o función específicos.
      - Estructura: los datos se han estructurado para obtener un acceso rápido y fácil.


      Tenga en cuenta que la mayoría de estas fuentes incorporan bases de datos relacionales. Las bases de datos relacionales no son tanto una fuente independiente como una técnica de almacenamiento de datos, normalmente en un formato organizado y coherente. Este tipo de bases de datos suelen admitir aplicaciones directamente, como las aplicaciones que procesan transacciones.