Visualisierung der Leistung von Regressionsmodellen
Nachdem du nun gesehen hast, wie du mehrere Modelle auswerten kannst, wirst du drei Regressionsmodelle erstellen, um die "energy"
eines Songs vorherzusagen.
Dem Datensatz music_df
wurden Dummy-Variablen für "genre"
hinzugefügt. Außerdem wurden Arrays für die Merkmale und das Ziel erstellt, die in X_train
, X_test
, y_train
und y_test
aufgeteilt wurden.
Folgendes wurde für dich importiert: LinearRegression
, Ridge
, Lasso
, cross_val_score
und KFold
.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Schreibe eine For-Schleife mit
model
als Iterator undmodel.values()
als iterierbares Element. - Führe mithilfe des Modells eine Kreuzvalidierung mit den Trainingsmerkmalen und dem Zielarray der Trainingsmenge durch und setze
cv
gleich demKFold
-Objekt. - Füge die Ergebnisse der Kreuzvalidierung des Modells an die Ergebnisliste an.
- Erstelle ein Kastendiagramm, das die Ergebnisse anzeigt, wobei die Beschriftungen der x-Achse die Namen der Modelle sind.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
models = {"Linear Regression": LinearRegression(), "Ridge": Ridge(alpha=0.1), "Lasso": Lasso(alpha=0.1)}
results = []
# Loop through the models' values
for ____ in models.values():
kf = KFold(n_splits=6, random_state=42, shuffle=True)
# Perform cross-validation
cv_scores = ____(____, ____, ____, cv=____)
# Append the results
____.____(____)
# Create a box plot of the results
plt.____(____, labels=____.____())
plt.show()