CommencerCommencer gratuitement

Ajuster un modèle de régression linéaire

Depuis 2015, une enquête anonyme sur les salaires est menée chaque année auprès de spécialistes IT en Europe. En 2018, des centaines de répondants ont accepté d’y participer. Les données de l’enquête incluent le nombre d’années d’expérience des répondants et leur salaire actuel.

Vous allez analyser la relation entre ces deux variables pour déterminer si davantage d’années d’expérience se traduit par un salaire plus élevé ou plus faible.

Votre variable indépendante est experience_years, et votre variable dépendante est current_salary.

Les données ont été chargées pour vous sous le nom data, ainsi que statsmodels.api et pandas, en tant que sm et pd, respectivement.

Cet exercice fait partie du cours

Analyser des données d’enquête en Python

Afficher le cours

Instructions

  • Définissez les variables x et y.
  • Ajoutez le terme constant.
  • Effectuez la régression avec OLS() puis .fit() le modèle.
  • Affichez le tableau récapitulatif.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Define variable, x and y
x = salary_survey.____.____
y = salary_survey.____.____

# Add the constant term
x = ____.____(x)

# Perform .OLS() regression and fit
result = ____.____(y,x).____()

# Print the summary table
print(____.____())
Modifier et exécuter le code