Ir al contenido principal

Diagrama de temas

    • Ciencia de datos

      La ciencia de datos es una disciplina que implica varias tareas: acumular y analizar datos, extraer valor de dichos datos y presentar ese valor de una manera significativa. En el aspecto científico, la ciencia de datos está estrechamente ligada al campo de la estadística. Los negocios también utilizan la ciencia de datos para analizar los datos que han recopilado para obtener información, mejorar los procesos e identificar nuevas oportunidades. En los negocios, la ciencia de datos a menudo se conoce como análisis o inteligencia de negocios.

      La ciencia de datos ha explotado en popularidad en la última década a medida que la computación en la nube y otros avances tecnológicos permiten a las personas registrar, almacenar y acceder a cantidades masivas de datos. Desde sus inicios, la ciencia de datos demandaba que un ser humano interpretara los datos y sacara conclusiones derivadas de ellos. Esto puede ser una tarea increíblemente difícil cuando al científico de datos se le presentan volúmenes de datos muy grandes o complejos. Estas inmensas colecciones de datos, a menudo llamadas big data, demandan un enfoque totalmente nuevo para el análisis del que las herramientas tradicionales son incapaces. Aquí es donde la IA, en especial el aprendizaje automático, puede ayudar.

      Por ejemplo, ha recopilado registros de salud de varios pacientes. Imagine que, en lugar de unos pocos cientos de registros en una hoja de cálculo, tiene miles o incluso millones de registros en una base de datos. Del mismo modo, imagine que tiene cientos o incluso miles de columnas (fragmentos de datos para cada registro, que en términos de ciencia de datos se denominan características). Puede usar el aprendizaje automático para analizar los datos y realizar predicciones sobre nuevos conjuntos de datos para determinar razonablemente si las personas en estos nuevos registros tienen enfermedad cardíaca o no.

      En otro ejemplo, es posible que un comerciante minorista en línea desee analizar los patrones de compra de los clientes para poder administrar el inventario y planificar eventos de ventas. En ese caso, posiblemente haya muchos clientes con muchas compras. El aprendizaje automático se puede utilizar para analizar los hábitos de compra e identificar patrones que lograrán los resultados que el comerciante minorista busca.

      El proceso real es más complejo que esto. El científico de datos necesita realizar varias tareas para orientar el proceso de aprendizaje, pero el punto sigue siendo el siguiente: el aprendizaje automático (incluido el aprendizaje profundo) puede extraer información de los datos de forma mucho más rápida y eficaz que un ser humano.

      Figura 1. Los principios de la ciencia de datos.

      Información adicional

      Para obtener más información acerca de lo que es la ciencia de datos, visite esta página.

      Para obtener más información acerca de lo que hacen los científicos de datos, visite esta página.