Visualisierung der Leistung von Regressionsmodellen

Nachdem du nun gesehen hast, wie du mehrere Modelle auswerten kannst, wirst du drei Regressionsmodelle erstellen, um die "energy" eines Songs vorherzusagen.

Dem Datensatz music_df wurden Dummy-Variablen für "genre" hinzugefügt. Außerdem wurden Arrays für die Merkmale und das Ziel erstellt, die in X_train, X_test, y_train und y_test aufgeteilt wurden.

Folgendes wurde für dich importiert: LinearRegression, Ridge, Lasso, cross_val_score und KFold.

Diese Übung ist Teil des Kurses

Überwachtes Lernen mit scikit-learn

Kurs anzeigen

Anleitung zur Übung

  • Schreibe eine For-Schleife mit model als Iterator und model.values() als iterierbares Element.
  • Führe mithilfe des Modells eine Kreuzvalidierung mit den Trainingsmerkmalen und dem Zielarray der Trainingsmenge durch und setze cv gleich dem KFold-Objekt.
  • Füge die Ergebnisse der Kreuzvalidierung des Modells an die Ergebnisliste an.
  • Erstelle ein Kastendiagramm, das die Ergebnisse anzeigt, wobei die Beschriftungen der x-Achse die Namen der Modelle sind.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

models = {"Linear Regression": LinearRegression(), "Ridge": Ridge(alpha=0.1), "Lasso": Lasso(alpha=0.1)}
results = []

# Loop through the models' values
for ____ in models.values():
  kf = KFold(n_splits=6, random_state=42, shuffle=True)
  
  # Perform cross-validation
  cv_scores = ____(____, ____, ____, cv=____)
  
  # Append the results
  ____.____(____)

# Create a box plot of the results
plt.____(____, labels=____.____())
plt.show()