CommencerCommencer gratuitement

Calculer l’impact des variables avec la régression linéaire

En tant que data scientist dans une compagnie d’assurances, votre mission consiste à construire et expliquer un modèle de régression linéaire qui estime les frais d’assurance à partir de variables comme l’âge, l’IMC et le statut de fumeur, en analysant les coefficients du modèle pour déterminer l’impact de chaque variable sur les prédictions.

matplotlib.pyplot a été importé sous le nom plt ainsi que MinMaxScaler. X_train et y_train sont déjà chargés pour vous.

Cet exercice fait partie du cours

IA explicable en Python

Afficher le cours

Instructions

  • Normalisez les données d’entraînement X_train.
  • Ajustez le model de régression linéaire sur les données d’entraînement standardisées.
  • Extrayez les coefficients du modèle.
  • Tracez les coefficients pour les feature_names fournies.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Standardize the training data
scaler = MinMaxScaler()
X_train_scaled = ____
model = LinearRegression()

# Fit the model
____

# Derive coefficients
coefficients = ____
feature_names = X_train.columns

# Plot coefficients
plt.bar(____, ____)
plt.show()
Modifier et exécuter le code