CommencerCommencer gratuitement

Tracer des régressions bootstrap

Une bonne manière de visualiser la variabilité attendue dans une régression linéaire consiste à tracer la droite obtenue pour chaque réplique bootstrap de la pente et de l’ordonnée à l’origine. Faites-le pour les 100 premières répliques bootstrap de la pente et de l’ordonnée à l’origine (stockées dans bs_slope_reps et bs_intercept_reps).

Cet exercice fait partie du cours

Réflexion statistique en Python (Partie 2)

Afficher le cours

Instructions

  • Générez un tableau de valeurs de \(x\) composé de 0 et 100 pour tracer les droites de régression. Utilisez pour cela la fonction np.array().
  • Écrivez une boucle for dans laquelle vous tracez une droite de régression avec une pente et une ordonnée à l’origine données par les répliques bootstrap par paires. Faites-le pour 100 droites.
    • Lors du tracé des droites de régression à chaque itération de la boucle for, rappelez-vous l’équation de régression y = a*x + b. Ici, a est bs_slope_reps[i] et b est bs_intercept_reps[i].
    • Indiquez les arguments nommés linewidth=0.5, alpha=0.2 et color='red' dans votre appel à plt.plot().
  • Réalisez un nuage de points avec illiteracy sur l’axe des abscisses et fertility sur l’axe des ordonnées. Pensez à préciser les arguments nommés marker='.' et linestyle='none'.
  • Étiquetez les axes, appliquez une marge de 2 % et affichez le graphique. Cela a été fait pour vous : cliquez sur Soumettre la réponse pour visualiser les régressions bootstrap !

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Generate array of x-values for bootstrap lines: x
x = ____

# Plot the bootstrap lines
for i in range(____):
    _ = plt.plot(____, 
                 ____*x + ____,
                 ____=0.5, ____=0.2, ____='red')

# Plot the data
_ = ____

# Label axes, set the margins, and show the plot
_ = plt.xlabel('illiteracy')
_ = plt.ylabel('fertility')
plt.margins(0.02)
plt.show()
Modifier et exécuter le code