LoslegenKostenlos loslegen

cross_val_score() implementieren

Dein Unternehmen hat mehrere neue Süßigkeiten entwickelt, ist sich aber unsicher, ob alle fünf auf den Markt kommen sollen. Um die Beliebtheit dieser neuen Süßigkeiten vorherzusagen, sollst du ein Regressionsmodell mit dem Candy-Datensatz bauen. Denk daran: Die Zielvariable ist der Head-to-Head‑Prozentsatz an Siegen gegen andere Süßigkeiten.

Bevor du verschiedene Regressionsmodelle ausprobierst, führst du Cross-Validation mit einem einfachen Random‑Forest‑Modell durch, um einen Basisfehler zu erhalten, mit dem du zukünftige Ergebnisse vergleichen kannst.

Diese Übung ist Teil des Kurses

Modellvalidierung in Python

Kurs anzeigen

Anleitung zur Übung

  • Ergänze cross_val_score().
    • Verwende X_train als Trainingsdaten und y_train als Zielvariable.
    • Nutze rfc als Modell, 10‑faches Cross-Validation und mse als Scoring-Funktion.
  • Gib den Mittelwert der cv-Ergebnisse aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

rfc = RandomForestRegressor(n_estimators=25, random_state=1111)
mse = make_scorer(mean_squared_error)

# Set up cross_val_score
cv = cross_val_score(estimator=____,
                     X=____,
                     y=____,
                     cv=____,
                     scoring=____)

# Print the mean error
print(cv.____())
Code bearbeiten und ausführen