Calculer l’impact des variables avec la régression linéaire
En tant que data scientist dans une compagnie d’assurances, votre mission consiste à construire et expliquer un modèle de régression linéaire qui estime les frais d’assurance à partir de variables comme l’âge, l’IMC et le statut de fumeur, en analysant les coefficients du modèle pour déterminer l’impact de chaque variable sur les prédictions.
matplotlib.pyplot a été importé sous le nom plt ainsi que MinMaxScaler. X_train et y_train sont déjà chargés pour vous.
Cet exercice fait partie du cours
IA explicable en Python
Instructions
- Normalisez les données d’entraînement
X_train. - Ajustez le
modelde régression linéaire sur les données d’entraînement standardisées. - Extrayez les
coefficientsdu modèle. - Tracez les
coefficientspour lesfeature_namesfournies.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Standardize the training data
scaler = MinMaxScaler()
X_train_scaled = ____
model = LinearRegression()
# Fit the model
____
# Derive coefficients
coefficients = ____
feature_names = X_train.columns
# Plot coefficients
plt.bar(____, ____)
plt.show()