Ein einfaches Modell trainieren
Wie du festgestellt hast, handelt es sich um ein Regressionsproblem. Du bist also bereit, ein Modell für eine spätere Einreichung zu bauen. Statt wie in den Folien das einfachste Lineare-Regressionsmodell zu verwenden, bauen wir jetzt ein Random-Forest-Modell out of the box.
Du wirst die Klasse RandomForestRegressor aus der Bibliothek scikit-learn verwenden.
Dein Ziel ist, ein Random-Forest-Modell mit Standardparametern auf den Merkmalen „store“ und „item“ zu trainieren.
Diese Übung ist Teil des Kurses
Eine Kaggle-Competition in Python gewinnen
Anleitung zur Übung
- Lies die Trainingsdaten mit
pandasein. - Erzeuge ein Random-Forest-Objekt.
- Trainiere das Random-Forest-Modell auf den Merkmalen „store“ und „item“ mit „sales“ als Zielvariable.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
import pandas as pd
from sklearn.ensemble import RandomForestRegressor
# Read the train data
train = ____.____('train.csv')
# Create a Random Forest object
rf = ____()
# Train a model
rf.fit(X=train[['store', ____]], y=train['____'])