Ir al contenido principal

Diagrama de temas

    • Diseño de las Características

      Diseño de las características


      El diseño de las características es la técnica que permite generar y extraer características de los datos para mejorar la capacidad de un modelo de aprendizaje automático para realizar estimaciones. Las características que tiene actualmente no son necesariamente las mejores características posibles para el problema que está tratando de resolver. Al crear características nuevas y de mayor utilidad, puede elaborar un modelo superior para una tarea determinada.

      El diseño de las características es realmente un término general para varios tipos de tareas que pueden lograr este objetivo. Varias de estas tareas se discutirán en breve, incluyendo:


      - Codificación de datos categóricos.
      - Agrupamiento de variables continuas.
      - División de las características.
      - Selección y extracción de características para reducir la dimensionalidad.

      Antes de empezar a diseñar nuevas características, debe asegurarse de haber completado algunas de las tareas de preprocesamiento antes mencionadas, especialmente el control de los datos faltantes y la eliminación de los valores duplicados. Debe determinar qué características se pueden eliminar directamente del conjunto de datos porque son redundantes o no tienen poder predictivo. Por ejemplo, user_id podría crear una buena clave principal en una tabla relacional, pero un modelo de aprendizaje automático probablemente no va a aprender mucho de ella. Una vez completadas estas tareas preliminares, puede pasar al diseño de las características.

      Información adicional

      Para obtener más información sobre el diseño de características, consulte este sitio.