Pickles
Jetzt ist es soweit: Du bringst dein erstes Modell in Produktion. Es handelt sich um einen Random-Forest-Klassifikator, den du als Baseline nutzt, während du noch an einer besseren Alternative arbeitest. Du hast Zugriff auf den üblichen Train-Test-Split der Daten mit den Namen X_train, X_test, y_train und y_test sowie auf die Module RandomForestClassifier() und pickle, deren Methoden .load() und .dump() du in dieser Übung brauchst.
Diese Übung ist Teil des Kurses
Machine-Learning-Workflows in Python entwerfen
Anleitung zur Übung
- Trainiere einen Random-Forest-Klassifikator auf den Daten. Setze den Zufallssamen auf 42, damit deine Ergebnisse reproduzierbar sind.
- Schreibe das Modell mit pickle in eine Datei. Öffne die Zieldatei mit der Syntax
with open(____) as ____. - Lade das Modell anschließend aus der Datei in eine andere Variable,
clf_from_file. - Speichere die Vorhersagen des geladenen Modells in der Variable
preds.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit a random forest to the training set
clf = ____(____=42).____(
X_train, y_train)
# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
pickle.____(clf, file=file)
# Now load the model from file in the production environment
with ____ as file:
clf_from_file = pickle.____(file)
# Predict the labels of the test dataset
preds = clf_from_file.____