Ir al contenido principal

Diagrama de temas

    • Clasificación Naïve Bayes

      Clasificación Naïve Bayes


      La clasificación Naïve Bayes es otro tipo de algoritmo de clasificación utilizado en el aprendizaje automático. Calcula las probabilidades de clasificación basadas en el teorema de Bayes, que, cuando se aplica a un problema de clasificación, se puede representar como:

      Donde:

      - y es la clasificación observada.

      - x es un vector (una matriz unidimensional) de las características del conjunto de datos.

      - p(y|x) es la probabilidad de y dada x. También se llama la probabilidad posterior. Esto es lo que está tratando de determinar.

      - p(x|y) es la probabilidad de x dada y.

      - p(y) es la probabilidad de y independiente de las características. También se llama la probabilidad anterior.

      - p(x) es la probabilidad de x independiente de la clase.

      El “ingenuo” en la clasificación Naïve Bayes se refiere al hecho de que las probabilidades se calculan con la suposición de que las características son condicionalmente independientes. En otras palabras, una característica no interactúa con otra. Si su conjunto de datos de encuesta de videojuegos tuviera campos como “Tiempo de reproducción” y “Partidos jugados”, no sería adecuado para la clasificación Naïve Bayes, ya que es probable que esas dos variables se influyan entre sí. En la práctica, es raro que un problema de aprendizaje automático o sus conjuntos de datos incluyan solo características independientes. Sin embargo, si se encuentra con una tarea de este tipo, los clasificadores Naïve Bayes pueden superar significativamente la regresión logística tanto en el tiempo de entrenamiento como en la habilidad del modelo.


      Una de las aplicaciones más comunes del mundo real de la clasificación Naïve Bayes es en el filtrado de spam. Los filtros de spam pueden analizar el texto de los correos electrónicos para que cada componente textual (por ejemplo, una palabra o frase) se analice independientemente de los demás. La presencia de ciertas palabras o frases puede solicitar al modelo que clasifique un mensaje de correo electrónico como “spam” o “no spam”, independientemente de cómo aparezcan estas palabras o frases en un contexto más amplio. Además, los clasificadores Naïve Bayes han encontrado éxito en el análisis de sentimientos, como determinar si los usuarios están satisfechos con un producto o servicio basado en el contenido de sus publicaciones en redes sociales.

      Información adicional

      Para obtener más información sobre la clasificación Naïve Bayes, consulte este sitio.