cross_val_score() implementieren
Dein Unternehmen hat mehrere neue Süßigkeiten entwickelt, ist sich aber unsicher, ob alle fünf auf den Markt kommen sollen. Um die Beliebtheit dieser neuen Süßigkeiten vorherzusagen, sollst du ein Regressionsmodell mit dem Candy-Datensatz bauen. Denk daran: Die Zielvariable ist der Head-to-Head‑Prozentsatz an Siegen gegen andere Süßigkeiten.
Bevor du verschiedene Regressionsmodelle ausprobierst, führst du Cross-Validation mit einem einfachen Random‑Forest‑Modell durch, um einen Basisfehler zu erhalten, mit dem du zukünftige Ergebnisse vergleichen kannst.
Diese Übung ist Teil des Kurses
Modellvalidierung in Python
Anleitung zur Übung
- Ergänze
cross_val_score().- Verwende
X_trainals Trainingsdaten undy_trainals Zielvariable. - Nutze
rfcals Modell, 10‑faches Cross-Validation undmseals Scoring-Funktion.
- Verwende
- Gib den Mittelwert der
cv-Ergebnisse aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
rfc = RandomForestRegressor(n_estimators=25, random_state=1111)
mse = make_scorer(mean_squared_error)
# Set up cross_val_score
cv = cross_val_score(estimator=____,
X=____,
y=____,
cv=____,
scoring=____)
# Print the mean error
print(cv.____())