Estimer l’erreur de test

Maintenant que vous avez votre posterior_predictive (disponible dans votre espace de travail), vous pouvez évaluer les performances du modèle sur de nouvelles données. Pour ce faire, vous devrez parcourir les observations de test et, pour chacune, calculer l’erreur de prédiction comme la différence entre la distribution prédictive pour cette observation et la valeur réelle observée. Cela vous donnera la distribution de l’erreur de votre modèle, que vous pourrez ensuite visualiser.

Vous aurez besoin de pymc3 et de numpy, déjà importés sous les noms pm et np, respectivement. Les données de test, bikes_test, sont également disponibles dans votre espace de travail. Allons-y !

Cet exercice fait partie du cours

Analyse de données bayésienne en Python

Afficher le cours

Instructions

Initialisez errors comme une liste vide.
Pour chaque ligne de bikes_test, calculez l’erreur de prédiction comme les tirages prédictifs pour cette ligne issus de posterior_predictive moins la valeur réelle unique de num_bikes pour la ligne.
Remodelez errors en les convertissant en tableau numpy puis en appliquant la méthode .reshape() au résultat, et affectez le résultat final à error_distribution.
Tracez la distribution de l’erreur de test à l’aide de la fonction plot_posterior() de pymc3.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Initialize errors
errors = ____

# Iterate over rows of bikes_test to compute error per row
for index, test_example in bikes_test.iterrows():
    error = ____[____][:, ____] - ____[____]
    errors.append(error)

# Reshape errors
error_distribution = ____(____).____()

# Plot the error distribution
____
plt.show()

Modifier et exécuter le code

Cet exercice fait partie du cours

Analyse de données bayésienne en Python

IntermédiaireNiveau de compétence

4.8+

Commencer le cours gratuitement

Faites vos premiers pas dans l’univers bayésien. Dans ce chapitre, vous découvrirez les notions essentielles de probabilité et de distributions statistiques, ainsi que le célèbre théorème de Bayes, pierre angulaire des méthodes bayésiennes. Pour finir, vous construirez votre premier modèle bayésien afin de tirer des conclusions à partir de lancers de pièce aléatoires.

Exercise 1: Qui est Bayes ? Qu’est-ce que Bayes ?Exercise 2: Bayésiens vs. Fréquentistes Exercise 3: Lois de probabilité Exercise 4: Probabilités et théorème de Bayes Exercise 5: Jouons aux cartes Exercise 6: Filtre antispam bayésien Exercise 7: Que dit le test ?Exercise 8: Goûter au Bayes Exercise 9: Lancer une pièce Exercise 10: Plus vous lancez, plus vous apprenez Exercise 11: Alors, cette pièce est-elle équilibrée ?

Il est temps de soulever le capot bayésien. Vous apprendrez à appliquer le théorème de Bayes à des données d’efficacité d’un médicament pour estimer les paramètres de distributions de probabilité à l’aide de la technique d’approximation par grille, puis à mettre à jour ces estimations à mesure que de nouvelles données arrivent. Ensuite, vous verrez comment intégrer des connaissances a priori dans le modèle, avant de vous exercer à l’indispensable compétence de restitution des résultats à un public non technique.

Exercise 1: Sous le capot bayésien Exercise 2: Vers l’approximation par grille Exercise 3: Approximation par grille sans connaissance a priori Exercise 4: Mise à jour de la croyance a posteriori Exercise 5: Croyance a priori Exercise 6: La vérité sur l’a priori Exercise 7: Choisir la bonne loi a priori Exercise 8: Simuler des tirages a posteriori Exercise 9: Présenter des résultats bayésiens Exercise 10: Estimations ponctuelles Exercise 11: Intervalles de crédibilité de densité a posteriori maximale Exercise 12: Le sens de la crédibilité

Mettez en pratique vos nouvelles compétences en analyse bayésienne pour résoudre des problématiques métiers réelles. Vous travaillerez sur des données de marketing de ventes en ligne pour mener des tests A/B, de l’analyse de décision et de la prévision avec des modèles de régression linéaire.

Exercise 1: Test A/B Exercise 2: Simuler une postérieure bêta Exercise 3: Taux de clics a posteriori Exercise 4: A ou B, et avec quel degré de certitude ?Exercise 5: Quel est le pire scénario ?Exercise 6: Analyse de décision Exercise 7: Analyse de décision : coût Exercise 8: Analyse de décision : profit Exercise 9: Régression et prévision Exercise 10: Définir un modèle de régression bayésienne Exercise 11: Analyzing regression parameters Exercise 12: Distribution prédictive

Dans ce dernier chapitre, vous exploiterez la puissance du package PyMC3 pour ajuster facilement des modèles de régression bayésiens, vérifier la convergence d’un modèle, choisir entre des modèles concurrents et générer des prédictions pour de nouvelles données. Pour conclure, vous appliquerez ce que vous avez appris afin de déterminer le prix optimal des avocats dans une étude de cas d’analyse bayésienne. Bonne chance !

Exercise 1: Chaînes de Markov Monte Carlo et ajustement de modèle Exercise 2: Chaîne de Markov Monte Carlo Exercise 3: Échantillonner des tirages a posteriori Exercise 4: Interpréter les résultats et comparer les modèles Exercise 5: Examiner les tirages a posteriori Exercise 6: Comparer des modèles avec la WAIC Exercise 7: Faire des prédictions Exercise 8: Échantillonner depuis la densité prédictive Exercise 9: Estimer l’erreur de test

Exercice en cours

Exercise 10: Combien coûte un avocat ?Exercise 11: Ajuster le modèle Exercise 12: Inspection du modèle Exercise 13: Optimiser le prix Exercise 14: Remarques finales