Ein einfaches Modell trainieren
Wie du festgestellt hast, handelt es sich um ein Regressionsproblem. Du bist also bereit, ein Modell für eine spätere Einreichung zu bauen. Statt wie in den Folien das einfachste Lineare-Regressionsmodell zu verwenden, bauen wir jetzt ein Random-Forest-Modell out of the box.
Du wirst die Klasse RandomForestRegressor aus der Bibliothek scikit-learn verwenden.
Dein Ziel ist, ein Random-Forest-Modell mit Standardparametern auf den Merkmalen „store“ und „item“ zu trainieren.
Diese Übung ist Teil des Kurses
<Kurs>Eine Kaggle-Competition in Python gewinnen</Kurs>Übungsanweisungen
- Lies die Trainingsdaten mit
pandasein. - Erzeuge ein Random-Forest-Objekt.
- Trainiere das Random-Forest-Modell auf den Merkmalen „store“ und „item“ mit „sales“ als Zielvariable.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
import pandas as pd
from sklearn.ensemble import RandomForestRegressor
# Read the train data
train = ____.____('train.csv')
# Create a Random Forest object
rf = ____()
# Train a model
rf.fit(X=train[['store', ____]], y=train['____'])