CommencerCommencer gratuitement

Variation en deux parties

On vous donne deux jeux de données distance-temps : l’un avec une très petite vitesse et l’autre avec une grande vitesse. Remarquez que tous deux peuvent avoir la même erreur standard de pente, mais des R-carré différents pour l’ensemble du modèle, selon la valeur de la pente (« taille d’effet ») comparée à l’erreur standard (« incertitude »).

Si l’on trace les deux jeux de données en nuage de points sur les mêmes axes, le contraste est net. La variation due à la pente est différente de la variation due à la dispersion aléatoire autour de la droite de tendance. Dans cet exercice, votre objectif est de calculer l’erreur standard et le R-carré pour deux jeux de données, puis de les comparer.

Cet exercice fait partie du cours

Introduction à la modélisation linéaire en Python

Afficher le cours

Instructions

  • Construisez et fit() un modèle ols() pour les deux jeux de données distances1 et distances2.
  • Utilisez la propriété .bse des modèles obtenus model_1 et model_2, ainsi que la clé 'times', pour extraire la valeur de l’erreur standard de la pente pour chaque modèle.
  • Utilisez l’attribut .rsquared pour extraire la valeur du R-carré de chaque modèle.
  • Affichez se_1, rsquared_1, se_2, rsquared_2, puis comparez visuellement.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Build and fit two models, for columns distances1 and distances2 in df
model_1 = ols(formula="____ ~ times", data=df).____()
model_2 = ols(formula="____ ~ times", data=df).____()

# Extract R-squared for each model, and the standard error for each slope
se_1 = model_1.____['times']
se_2 = model_2.____['times']
rsquared_1 = model_1.____
rsquared_2 = model_2.____

# Print the results
print('Model 1: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))
print('Model 2: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))
Modifier et exécuter le code