Ir al contenido principal

Diagrama de temas

    • Big data


      Big data se refiere a cantidades masivas de datos que no se pueden traducir fácilmente en inteligencia procesable utilizando métodos y tecnologías tradicionales. Las nuevas fuentes de datos, como los dispositivos inteligentes, las aplicaciones web y móviles y las plataformas de redes sociales, pueden empequeñecer las cantidades de datos procedentes de fuentes de datos tradicionales, como los formularios de papeleo y las transacciones comerciales.

      Estos datos se escalan para convertirse en grandes debido a al menos tres factores principales, que a veces se describen por tres V: volumen, variedad y velocidad.


      Figura 1. Las tres V del big data.
      Factores del big data Descripción
      Volumen El gran número de bytes de datos que se capturan es una de las dimensiones de big data. La capacidad de almacenar gran cantidad de datos que ofrece el almacenamiento en la nube ha llevado a que las aplicaciones se diseñen para capturar y acumular cantidades masivas de datos.
      Variedad En el pasado, gran parte de los datos capturados para su uso en el análisis de datos provenían de fuentes de datos estructuradas, como bases de datos y registros de transacciones. Más recientemente, los tipos de datos complejos y no estructurados se capturan de fuentes como sitios web, sitios de redes sociales, dispositivos inteligentes y cámaras. Ahora se captura una amplia variedad de tipos de datos, como imágenes, grabaciones de voz y otras publicaciones de audio, video, web y redes sociales.
      Velocidad La velocidad a la que debe producirse el procesamiento de datos. Con fuentes de datos como dispositivos inteligentes, los datos a menudo deben recopilarse y procesarse en tiempo real o casi en tiempo real.

      Nota: La veracidad (la precisión o fiabilidad de los datos) a menudo se incluye como una cuarta V de los desafíos del big data. Esto se refiere al hecho de que muchas fuentes de big data pueden no ser completamente confiables.