Estimación del error de test

Ahora que tienes posterior_predictive (disponible en tu espacio de trabajo), puedes evaluar el rendimiento del modelo en datos nuevos. Para ello, tendrás que iterar sobre las observaciones de test y, para cada una, calcular el error de predicción como la diferencia entre la distribución predictiva de esa observación y su valor real. Esto te dará la distribución del error de tu modelo, que luego podrás visualizar.

Vas a necesitar pymc3 y numpy, que ya se han importado como pm y np, respectivamente. Los datos de test, bikes_test, también están disponibles en tu espacio de trabajo. ¡Manos a la obra!

Este ejercicio forma parte del curso

Análisis de datos bayesiano en Python

Instrucciones del ejercicio

Inicializa errors como una lista vacía.
Para cada fila en bikes_test, calcula el error de predicción como las muestras predictivas para esa fila desde posterior_predictive menos el valor real único de num_bikes de la fila.
Reordena errors convirtiéndolos en un array de numpy y aplicando el método .reshape() al resultado, y asigna el resultado final a error_distribution.
Representa la distribución del error de test usando la función plot_posterior() de pymc3.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Initialize errors
errors = ____

# Iterate over rows of bikes_test to compute error per row
for index, test_example in bikes_test.iterrows():
    error = ____[____][:, ____] - ____[____]
    errors.append(error)

# Reshape errors
error_distribution = ____(____).____()

# Plot the error distribution
____
plt.show()

Editar y ejecutar código

Este ejercicio forma parte del curso

Análisis de datos bayesiano en Python

IntermedioNivel de habilidad

4.8+

Empieza el curso gratis

Da tus primeros pasos en el mundo bayesiano. En este capítulo, conocerás los conceptos básicos de probabilidad y distribuciones estadísticas, así como el famoso Teorema de Bayes, la piedra angular de los métodos bayesianos. Para terminar, construirás tu primer modelo bayesiano para sacar conclusiones a partir de lanzamientos aleatorios de una moneda.

Exercise 1: ¿Quién es Bayes? ¿Qué es Bayes?Exercise 2: Bayesianos vs. Frecuentistas Exercise 3: Distribuciones de probabilidad Exercise 4: Probabilidad y el teorema de Bayes Exercise 5: Juguemos a las cartas Exercise 6: Filtro de spam bayesiano Exercise 7: ¿Qué dice la prueba?Exercise 8: Probando a Bayes Exercise 9: Lanzar una moneda Exercise 10: Cuantas más veces lances, más aprendes Exercise 11: Oye, ¿es justa esta moneda?

Es hora de mirar bajo el capó bayesiano. Aprenderás a aplicar el Teorema de Bayes a datos sobre la efectividad de un fármaco para estimar los parámetros de distribuciones de probabilidad mediante la técnica de aproximación por rejilla y a actualizar estas estimaciones a medida que llega nueva información. Después, verás cómo incorporar conocimiento previo en el modelo y, para finalizar, practicarás la importante habilidad de comunicar resultados a un público no técnico.

Exercise 1: Bajo el capó bayesiano Exercise 2: Hacia la aproximación por rejilla Exercise 3: Aproximación por rejilla sin conocimiento previo Exercise 4: Actualizando la creencia posterior Exercise 5: Creencia previa Exercise 6: La verdad del previo Exercise 7: Elegir la prior adecuada Exercise 8: Simulando extracciones a posteriori Exercise 9: Comunicar resultados bayesianos Exercise 10: Estimaciones puntuales Exercise 11: Intervalos creíbles de densidad posterior más alta Exercise 12: El significado de credibilidad

Aplica tus nuevas habilidades de análisis de datos bayesiano para resolver retos empresariales reales. Trabajarás con datos de marketing de ventas online para realizar pruebas A/B, análisis de decisiones y predicción con modelos de regresión lineal.

Exercise 1: Pruebas A/B Exercise 2: Simula una posterior beta Exercise 3: Tasas de clic posteriores Exercise 4: ¿A o B, y cuánta seguridad tenemos?Exercise 5: ¿Qué tan mal puede salir?Exercise 6: Análisis de decisiones Exercise 7: Análisis de decisiones: coste Exercise 8: Análisis de decisiones: beneficio Exercise 9: Regresión y previsión Exercise 10: Definir un modelo de regresión bayesiana Exercise 11: Analizando los parámetros de la regresión Exercise 12: Distribución predictiva

En este capítulo final, aprovecharás la potente librería PyMC3 para ajustar fácilmente modelos de regresión bayesianos, comprobar la convergencia del modelo, elegir entre modelos alternativos y generar predicciones para nuevos datos. Para cerrar, aplicarás lo aprendido para encontrar el precio óptimo de los aguacates en un caso práctico de análisis bayesiano. ¡Suerte!

Exercise 1: Muestreo de cadenas de Markov (MCMC) y ajuste de modelos Exercise 2: Markov Chain Monte Carlo Exercise 3: Muestrear valores del posterior Exercise 4: Interpretar resultados y comparar modelos Exercise 5: Inspeccionar extracciones posteriores Exercise 6: Comparación de modelos con WAIC Exercise 7: Hacer predicciones Exercise 8: Muestrear de la densidad predictiva Exercise 9: Estimación del error de test

Ejercicio actual

Exercise 10: ¿Cuánto cuesta un aguacate?Exercise 11: Ajustar el modelo Exercise 12: Inspeccionando el modelo Exercise 13: Optimizar el precio Exercise 14: Comentarios finales