Elemento |
Descripción |
---|---|
Enmarque el problema. |
Registre una descripción del problema que pretende resolver, escrita claramente como si planease entregarla a otra persona para su posterior desarrollo. El proceso de tener que poner el problema en palabras le ayudará a pensar y aclarar sus intenciones. Siga un patrón como el siguiente:
- Tarea (T): lo que el algoritmo debe lograr, por ejemplo, "Predecir el precio de venta de una tarjeta coleccionable".- Experiencia (E): el conjunto de datos utiliza el algoritmo para aprender, por ejemplo, "Registros de transacciones de tarjetas coleccionables en varios sitios web".- Rendimiento (P): cómo evaluará el rendimiento del modelo, por ejemplo, "¿Qué tan cerca estuvo el precio de venta previsto del precio de venta real?". La forma de medir esto depende del tipo de tarea que realice el algoritmo. |
Identifique por qué se debe resolver el problema. |
Los aspectos de esto incluyen los siguientes:- Justificación: identificar por qué necesita resolver este problema le ayudará a evaluar el resultado, hacer los arreglos apropiados a medida que genera la solución y determinar cuándo ha logrado lo que se propuso hacer.- Beneficios: identifique quién se beneficiará de la solución y cómo. Esta información será útil si necesita obtener la aceptación de partes interesadas o financiadores, o para vender a otros en función de la necesidad de recursos adicionales o tiempo para hacer el trabajo. También será útil hacer referencia a cuando intente determinar cómo evaluará el éxito.- Duración y uso: identifique quién usará la solución y durante cuánto tiempo se usará. Esto le ayudará a determinar qué tan "pulida" debe estar la solución, cómo necesitará respaldarla y a considerar los requisitos de implementación si habrá otros usuarios.Asegurarse de que tiene claras estas cosas le ayudará a resolver el problema correcto, de una manera que realmente generará los beneficios que estaba buscando en primer lugar.
|
Proporcione información de fondo que lo ayudará a resolver el problema. |
Como recordatorio para usted mismo si está desarrollando la solución, o para brindar orientación a otras personas que trabajarán con usted o para usted, mientras piensa en el problema, documente cosas como las siguientes:- Supuestos: una lista de supuestos sobre el problema, como, por ejemplo:- fuentes de datos cuyo uso es aceptable o inaceptable;- requisitos operativos especiales, como los entornos de software que debe utilizar;- negocio u otro contexto de marco, como los marcos de tiempo del proyecto, quién usará la solución, etc.- Problemas de referencia: una lista de problemas similares que ha resuelto a través del aprendizaje automático aplicado. Esta lista lo guiará hacia el abordaje que podría adoptar para implementar una solución. |
Decida si el problema es adecuado para IA/AA. |
Una vez que haya definido claramente el problema, puede explorar si es más apropiado resolverlo como un problema de IA/AA o como un problema de programación tradicional. |
Para obtener información adicional sobre las características, consulte aquí.
El aprendizaje semisupervisado es una combinación de aprendizaje supervisado y sin supervisión. En un conjunto de datos, normalmente tendrá muchos ejemplos sin etiquetar y algunos ejemplos etiquetados. Esta estrategia semisupervisada es particularmente útil en los casos en que el etiquetado de todos los datos llevaría mucho tiempo, o sería prohibitivo en términos de costos o inviable. Etiquetar solo algunos de los datos puede no ser ideal, pero puede mejorar el rendimiento del modelo sobre el aprendizaje sin supervisión estándar. En última instancia, el objetivo es lograr un equilibrio entre la sobrecarga involucrada en el etiquetado de datos y el poder predictivo real del modelo.
Resultado |
Descripción |
---|---|
Regresión |
En función de una o más variables de entrada, prediga la variable de resultado obtenida.
|
Clasificación |
En función de una nueva instancia de datos, identificar la clase a la que pertenece.
La meta puede ser colocar simplemente la instancia de datos en una clase o categoría predefinidas. Por ejemplo, el software de reconocimiento óptico de caracteres (OCR) puede utilizar la clasificación para clasificar un carácter como una letra conocida o desconocida. |
Agrupación en clústeres |
Sin ningún conocimiento previo de la estructura de un conjunto de datos, identifique los componentes que pertenecen a un grupo en común.
Este resultado ayuda a revelar la composición y estructura de un conjunto determinado de datos. Cada clúster se caracteriza por un conjunto contenido de puntos de datos y un centroide de clúster. El centroide del clúster es básicamente la media (promedio) de todos los puntos de datos que contiene el clúster, en todas las características. Por ejemplo, los datos sobre la altura, el peso y la actividad física podrían usarse para agrupar a los miembros del plan de salud para que aquellos con mayor riesgo de enfermedad cardíaca puedan recibir intervenciones. |
Más información sobre la incertidumbre en los modelos de aprendizaje automático, ingresa aquí