Aan de slagGa gratis aan de slag

De impact van features berekenen met lineaire regressie

Als data scientist bij een verzekeringsmaatschappij is het jouw taak om een lineair regressiemodel te bouwen én uit te leggen dat de verzekeringskosten schat op basis van features zoals leeftijd, BMI en rookstatus. Analyseer de coëfficiënten van het model om te bepalen wat de impact van elke feature is op de voorspellingen.

matplotlib.pyplot is geïmporteerd als plt, samen met MinMaxScaler. X_train en y_train zijn alvast voor je ingeladen.

Deze oefening maakt deel uit van de cursus

Explainable AI in Python

Cursus bekijken

Oefeninstructies

  • Normaliseer de trainingsgegevens X_train.
  • Fit het lineaire regressiemodel op de gestandaardiseerde trainingsgegevens.
  • Haal de coefficients uit het model.
  • Plot de coefficients voor de gegeven feature_names.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Standardize the training data
scaler = MinMaxScaler()
X_train_scaled = ____
model = LinearRegression()

# Fit the model
____

# Derive coefficients
coefficients = ____
feature_names = X_train.columns

# Plot coefficients
plt.bar(____, ____)
plt.show()
Code bewerken en uitvoeren