Ir al contenido principal

Diagrama de temas

    • Preprocesamiento de Datos

      Preprocesamiento de datos


      El preprocesamiento de datos es la tarea de aplicar varias técnicas de transformación y codificación a los datos para que un algoritmo de aprendizaje automático los pueda interpretar y analizar. La parte "previa" del preprocesamiento implica que los datos se están preparando, de manera similar a como ETL prepara los datos en las primeras etapas. La diferencia es que, en el preprocesamiento, gran parte de la transformación preliminar ya está hecha y en realidad solo se enfoca en prepararse para el aprendizaje automático. El preprocesamiento es importante porque todos los algoritmos de aprendizaje automático tienen diferentes conjuntos de desafíos y requisitos, por lo que debe asegurarse de que los datos puedan adaptarse a ellos. Si piensa que su proyecto de IA avanza hacia la creación de un modelo de aprendizaje automático, el preprocesamiento es el último paso.

      Hay muchas técnicas que se definen como de preprocesamiento, entre las que se encuentran las siguientes:
      Identificación y control de valores faltantes.
      Escalado de variables mediante normalización y estandarización.
      Eliminación de características innecesarias o inservibles.
      Diseño de nuevas características.
      Nota: Algunos profesionales optan por controlar los valores faltantes al principio del proceso de ETL.
      Información adicional

      Para obtener más información sobre el preprocesamiento de datos, consulte este sitio.