Ajuster un modèle de régression linéaire
Depuis 2015, une enquête anonyme sur les salaires est menée chaque année auprès de spécialistes IT en Europe. En 2018, des centaines de répondants ont accepté d’y participer. Les données de l’enquête incluent le nombre d’années d’expérience des répondants et leur salaire actuel.
Vous allez analyser la relation entre ces deux variables pour déterminer si davantage d’années d’expérience se traduit par un salaire plus élevé ou plus faible.
Votre variable indépendante est experience_years, et votre variable dépendante est current_salary.
Les données ont été chargées pour vous sous le nom data, ainsi que statsmodels.api et pandas, en tant que sm et pd, respectivement.
Cet exercice fait partie du cours
Analyser des données d’enquête en Python
Instructions
- Définissez les variables
xety. - Ajoutez le terme constant.
- Effectuez la régression avec
OLS()puis.fit()le modèle. - Affichez le tableau récapitulatif.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Define variable, x and y
x = salary_survey.____.____
y = salary_survey.____.____
# Add the constant term
x = ____.____(x)
# Perform .OLS() regression and fit
result = ____.____(y,x).____()
# Print the summary table
print(____.____())