Repositorio de datos | Descripción |
---|---|
Lago de datos |
- Propósito: aprendizaje automático, análisis de big data, análisis predictivo (uso de estadísticas para realizar predicciones sobre eventos futuros) y descubrimiento de datos (extracción de información útil de grandes conjuntos de datos). Los datos pueden utilizarse en cualquier momento o nunca. Es posible que aún no exista un propósito específico para conservar los datos, pero se conserva para posibles necesidades futuras.
- Fuente: datos estructurados y no estructurados de muchas fuentes, como dispositivos inteligentes, sitios web, aplicaciones, registros de servidores, etc. - Estructura: muy variable. Por lo general, los datos se mantienen en sus formas originales, que pueden incluir tipos de datos no tradicionales, como registros de servidores web, datos de sensores, actividad de redes sociales, texto e imágenes. Consumir y almacenar datos como este puede ser costoso y difícil. |
Almacén de datos operativos |
- Propósito: recopila, agrega y prepara datos para su uso en operaciones. Puede alimentar a un almacén de datos.
- Fuente: datos transaccionales (datos sobre eventos que incluyen algún tipo de intercambio, como la compra de un producto) capturados de varias aplicaciones y otras fuentes. - Estructura: los datos se han estructurado para un acceso rápido y fácil, pero pueden requerir una preparación adicional antes de que se puedan transferir a un almacén de datos. |
Almacén de datos |
- Propósito: análisis de datos para información, informes por lotes y visualización de datos (traducción de datos en gráficos, tablas y otros objetos visuales).
- Fuente: datos relacionales capturados de múltiples fuentes relacionales, incluidas aplicaciones, sistemas transaccionales y bases de datos de operaciones, generalmente dentro de una única organización, como una empresa, una agencia gubernamental, una universidad o un sistema de atención médica. - Estructura: los datos se han estructurado para obtener un acceso rápido y fácil.
|
Data mart |
- Propósito: datos utilizados para apoyar un tipo particular de análisis.
- Fuente: una subsección del almacén de datos, que aloja datos destinados específicamente a admitir un tipo particular de análisis o abordar un requisito o función específicos. - Estructura: los datos se han estructurado para obtener un acceso rápido y fácil. |