Berechnung des Einflusses von Merkmalen mit linearer Regression
Als Data Scientist bei einem Versicherungsunternehmen ist es deine Aufgabe, ein lineares Regressionsmodell zu erstellen, das die Versicherungskosten anhand von Merkmalen wie Alter, BMI und Rauchgewohnheiten schätzt. Um die Prognosen des Modells zu erklären, analysierst du die Modellkoeffizienten, damit du den Einfluss der einzelnen Merkmale auf die Vorhersagen bestimmen kannst.
matplotlib.pyplot
wurde als plt
zusammen mit MinMaxScaler
importiert. X_train
und y_train
sind bereits geladen.
Diese Übung ist Teil des Kurses
Erklärbare KI in Python
Anleitung zur Übung
- Normalisiere die Trainingsdaten
X_train
. - Passe das lineare Regressionsmodell (
model
) an die standardisierten Trainingsdaten an. - Extrahiere die Koeffizienten (
coefficients
) aus dem Modell. - Erstelle ein Diagramm der Koeffizienten für die angegebenen Merkmalsnamen (
feature_names
).
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Standardize the training data
scaler = MinMaxScaler()
X_train_scaled = ____
model = LinearRegression()
# Fit the model
____
# Derive coefficients
coefficients = ____
feature_names = X_train.columns
# Plot coefficients
plt.bar(____, ____)
plt.show()