Tracer des régressions bootstrap
Une bonne manière de visualiser la variabilité attendue dans une régression linéaire consiste à tracer la droite obtenue pour chaque réplique bootstrap de la pente et de l’ordonnée à l’origine. Faites-le pour les 100 premières répliques bootstrap de la pente et de l’ordonnée à l’origine (stockées dans bs_slope_reps et bs_intercept_reps).
Cet exercice fait partie du cours
Réflexion statistique en Python (Partie 2)
Instructions
- Générez un tableau de valeurs de \(x\) composé de
0et100pour tracer les droites de régression. Utilisez pour cela la fonctionnp.array(). - Écrivez une boucle
fordans laquelle vous tracez une droite de régression avec une pente et une ordonnée à l’origine données par les répliques bootstrap par paires. Faites-le pour100droites.- Lors du tracé des droites de régression à chaque itération de la boucle
for, rappelez-vous l’équation de régressiony = a*x + b. Ici,aestbs_slope_reps[i]etbestbs_intercept_reps[i]. - Indiquez les arguments nommés
linewidth=0.5,alpha=0.2etcolor='red'dans votre appel àplt.plot().
- Lors du tracé des droites de régression à chaque itération de la boucle
- Réalisez un nuage de points avec
illiteracysur l’axe des abscisses etfertilitysur l’axe des ordonnées. Pensez à préciser les arguments nommésmarker='.'etlinestyle='none'. - Étiquetez les axes, appliquez une marge de 2 % et affichez le graphique. Cela a été fait pour vous : cliquez sur Soumettre la réponse pour visualiser les régressions bootstrap !
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Generate array of x-values for bootstrap lines: x
x = ____
# Plot the bootstrap lines
for i in range(____):
_ = plt.plot(____,
____*x + ____,
____=0.5, ____=0.2, ____='red')
# Plot the data
_ = ____
# Label axes, set the margins, and show the plot
_ = plt.xlabel('illiteracy')
_ = plt.ylabel('fertility')
plt.margins(0.02)
plt.show()