Régression linéaire sur des données pertinentes d’Anscombe
Pour vous entraîner, effectuez une régression linéaire sur l’ensemble de données du quartet d’Anscombe qui se prête le mieux à une interprétation linéaire.
Cet exercice fait partie du cours
Réflexion statistique en Python (Partie 2)
Instructions
- Calculez les paramètres de la pente et de l’ordonnée à l’origine avec
np.polyfit(). Les données d’Anscombe sont stockées dans les tableauxxety. - Affichez la pente
aet l’ordonnée à l’origineb. - Générez des données théoriques \(x\) et \(y\) à partir de la régression linéaire. Votre tableau \(x\), que vous pouvez créer avec
np.array(), doit contenir3et15. Pour générer les données \(y\), multipliez la pente parx_theoret ajoutez l’ordonnée à l’origine. - Représentez les données d’Anscombe sous forme de nuage de points, puis tracez la droite théorique. N’oubliez pas d’inclure les arguments nommés
marker='.'etlinestyle='none'en plus dexetylorsque vous tracez le nuage de points des données d’Anscombe. Vous n’avez pas besoin de ces arguments pour tracer la droite théorique. - Appuyez sur Soumettre la réponse pour afficher le graphique !
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Perform linear regression: a, b
a, b = ____
# Print the slope and intercept
print(____, ____)
# Generate theoretical x and y data: x_theor, y_theor
x_theor = np.array([____, ____])
y_theor = ____ * ____ + ____
# Plot the Anscombe data and theoretical line
_ = ____
_ = ____
# Label the axes
plt.xlabel('x')
plt.ylabel('y')
# Show the plot
plt.show()