Visualisierung der Leistung von Regressionsmodellen
Nachdem du im Video gesehen hast, wie du mehrere Modelle auswerten kannst, erstellst du nun drei Regressionsmodelle, um die Energiepegel von Songs vorherzusagen.
Dem Datensatz music_df
wurden Dummy-Variablen für "genre"
hinzugefügt. Außerdem wurden Arrays für die Merkmale und die Zielvariable erstellt und in X_train
, X_test
, y_train
und y_test
aufgeteilt.
Folgendes wurde bereits importiert: LinearRegression
, Ridge
, Lasso
, cross_val_score
und KFold
.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Schreibe eine For-Schleife mit
model
als Iterator undmodel.values()
als iterierbares Element. - Führe mithilfe des Modells eine Kreuzvalidierung mit den Merkmalen und der Zielvariablen der Trainingsmenge durch und setze
cv
gleich demKFold
-Objekt. - Füge die Ergebnisse der Kreuzvalidierung des Modells an die Ergebnisliste an.
- Erstelle ein Kastendiagramm zur Anzeige der Ergebnisse und nutze die Namen der Modelle zur Beschriftung der x-Achse.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
models = {"Linear Regression": LinearRegression(), "Ridge": Ridge(alpha=0.1), "Lasso": Lasso(alpha=0.1)}
results = []
# Loop through the models' values
for ____ in models.values():
kf = KFold(n_splits=6, random_state=42, shuffle=True)
# Perform cross-validation
cv_scores = ____(____, ____, ____, cv=____)
# Append the results
____.____(____)
# Create a box plot of the results
plt.____(____, labels=____.____())
plt.show()