De impact van features berekenen met lineaire regressie
Als data scientist bij een verzekeringsmaatschappij is het jouw taak om een lineair regressiemodel te bouwen én uit te leggen dat de verzekeringskosten schat op basis van features zoals leeftijd, BMI en rookstatus. Analyseer de coëfficiënten van het model om te bepalen wat de impact van elke feature is op de voorspellingen.
matplotlib.pyplot is geïmporteerd als plt, samen met MinMaxScaler. X_train en y_train zijn alvast voor je ingeladen.
Deze oefening maakt deel uit van de cursus
Explainable AI in Python
Oefeninstructies
- Normaliseer de trainingsgegevens
X_train. - Fit het lineaire regressie
modelop de gestandaardiseerde trainingsgegevens. - Haal de
coefficientsuit het model. - Plot de
coefficientsvoor de gegevenfeature_names.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Standardize the training data
scaler = MinMaxScaler()
X_train_scaled = ____
model = LinearRegression()
# Fit the model
____
# Derive coefficients
coefficients = ____
feature_names = X_train.columns
# Plot coefficients
plt.bar(____, ____)
plt.show()