Filtro de spam bayesiano

¡Bien hecho en el ejercicio anterior! Ahora vamos a abordar el famoso Teorema de Bayes y a usarlo para una tarea sencilla pero importante: detectar spam.

Revisando tu bandeja de entrada, te has dado cuenta de que muchos de los correos que preferirías no leer contienen frases exclamativas, como "¡COMPRA YA!!!". Empiezas a pensar que la presencia de tres signos de exclamación seguidos podría ser un buen predictor de spam. Para comprobarlo, has preparado un DataFrame llamado emails con dos variables: spam, que indica si el correo es spam, y contains_3_exlc, que indica si contiene la cadena "!!!". El encabezado de los datos es el siguiente:

     spam    contains_3_excl
0    False             False
1    False             False
2    True              False
3    False             False
4    False             False

Tu tarea es calcular la probabilidad de que un correo sea spam dado que contiene tres signos de exclamación. Vamos paso a paso. Aquí tienes la fórmula de Bayes como referencia:

$$P(A|B) = \frac{P(B|A) * P(A)}{P(B)}$$

Este ejercicio forma parte del curso

Análisis de datos bayesiano en Python

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate and print the unconditional probability of spam
p_spam = ____[____].____
print(____)

Editar y ejecutar código

Este ejercicio forma parte del curso

Análisis de datos bayesiano en Python

IntermedioNivel de habilidad

4.8+

Comienza el curso gratis

Da tus primeros pasos en el mundo bayesiano. En este capítulo, conocerás los conceptos básicos de probabilidad y distribuciones estadísticas, así como el famoso Teorema de Bayes, la piedra angular de los métodos bayesianos. Para terminar, construirás tu primer modelo bayesiano para sacar conclusiones a partir de lanzamientos aleatorios de una moneda.

Exercise 1: ¿Quién es Bayes? ¿Qué es Bayes?Exercise 2: Bayesianos vs. Frecuentistas Exercise 3: Distribuciones de probabilidad Exercise 4: Probabilidad y el teorema de Bayes Exercise 5: Juguemos a las cartas Exercise 6: Filtro de spam bayesiano

Ejercicio actual

Exercise 7: ¿Qué dice la prueba?Exercise 8: Probando a Bayes Exercise 9: Lanzar una moneda Exercise 10: Cuantas más veces lances, más aprendes Exercise 11: Oye, ¿es justa esta moneda?

Es hora de mirar bajo el capó bayesiano. Aprenderás a aplicar el Teorema de Bayes a datos sobre la efectividad de un fármaco para estimar los parámetros de distribuciones de probabilidad mediante la técnica de aproximación por rejilla y a actualizar estas estimaciones a medida que llega nueva información. Después, verás cómo incorporar conocimiento previo en el modelo y, para finalizar, practicarás la importante habilidad de comunicar resultados a un público no técnico.

Exercise 1: Bajo el capó bayesiano Exercise 2: Hacia la aproximación por rejilla Exercise 3: Aproximación por rejilla sin conocimiento previo Exercise 4: Actualizando la creencia posterior Exercise 5: Creencia previa Exercise 6: La verdad del previo Exercise 7: Elegir la prior adecuada Exercise 8: Simulando extracciones a posteriori Exercise 9: Comunicar resultados bayesianos Exercise 10: Estimaciones puntuales Exercise 11: Intervalos creíbles de densidad posterior más alta Exercise 12: El significado de credibilidad

Aplica tus nuevas habilidades de análisis de datos bayesiano para resolver retos empresariales reales. Trabajarás con datos de marketing de ventas online para realizar pruebas A/B, análisis de decisiones y predicción con modelos de regresión lineal.

Exercise 1: Pruebas A/B Exercise 2: Simula una posterior beta Exercise 3: Tasas de clic posteriores Exercise 4: ¿A o B, y cuánta seguridad tenemos?Exercise 5: ¿Qué tan mal puede salir?Exercise 6: Análisis de decisiones Exercise 7: Análisis de decisiones: coste Exercise 8: Análisis de decisiones: beneficio Exercise 9: Regresión y previsión Exercise 10: Definir un modelo de regresión bayesiana Exercise 11: Analizando los parámetros de la regresión Exercise 12: Distribución predictiva

En este capítulo final, aprovecharás la potente librería PyMC3 para ajustar fácilmente modelos de regresión bayesianos, comprobar la convergencia del modelo, elegir entre modelos alternativos y generar predicciones para nuevos datos. Para cerrar, aplicarás lo aprendido para encontrar el precio óptimo de los aguacates en un caso práctico de análisis bayesiano. ¡Suerte!

Exercise 1: Muestreo de cadenas de Markov (MCMC) y ajuste de modelos Exercise 2: Markov Chain Monte Carlo Exercise 3: Muestrear valores del posterior Exercise 4: Interpretar resultados y comparar modelos Exercise 5: Inspeccionar extracciones posteriores Exercise 6: Comparación de modelos con WAIC Exercise 7: Hacer predicciones Exercise 8: Muestrear de la densidad predictiva Exercise 9: Estimación del error de test Exercise 10: ¿Cuánto cuesta un aguacate?Exercise 11: Ajustar el modelo Exercise 12: Inspeccionando el modelo Exercise 13: Optimizar el precio Exercise 14: Comentarios finales