LoslegenKostenlos loslegen

Pickles

Jetzt ist es soweit: Du bringst dein erstes Modell in Produktion. Es handelt sich um einen Random-Forest-Klassifikator, den du als Baseline nutzt, während du noch an einer besseren Alternative arbeitest. Du hast Zugriff auf den üblichen Train-Test-Split der Daten mit den Namen X_train, X_test, y_train und y_test sowie auf die Module RandomForestClassifier() und pickle, deren Methoden .load() und .dump() du in dieser Übung brauchst.

Diese Übung ist Teil des Kurses

Machine-Learning-Workflows in Python entwerfen

Kurs anzeigen

Anleitung zur Übung

  • Trainiere einen Random-Forest-Klassifikator auf den Daten. Setze den Zufallssamen auf 42, damit deine Ergebnisse reproduzierbar sind.
  • Schreibe das Modell mit pickle in eine Datei. Öffne die Zieldatei mit der Syntax with open(____) as ____.
  • Lade das Modell anschließend aus der Datei in eine andere Variable, clf_from_file.
  • Speichere die Vorhersagen des geladenen Modells in der Variable preds.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Fit a random forest to the training set
clf = ____(____=42).____(
  X_train, y_train)

# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
    pickle.____(clf, file=file)

# Now load the model from file in the production environment
with ____ as file:
    clf_from_file = pickle.____(file)

# Predict the labels of the test dataset
preds = clf_from_file.____
Code bearbeiten und ausführen