IniziaInizia gratis

Pickle

Finalmente è il momento di portare in produzione il tuo primo modello. Si tratta di un classificatore random forest che userai come baseline, mentre lavori per sviluppare un'alternativa migliore. Hai a disposizione il classico split in training e test con i nomi X_train, X_test, y_train e y_test, oltre ai moduli RandomForestClassifier() e pickle, di cui ti serviranno i metodi .load() e .dump() per questo esercizio.

Questo esercizio fa parte del corso

Progettare workflow di Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Allena un classificatore random forest sui dati. Fissa il seme casuale a 42 per garantire la riproducibilità dei risultati.
  • Scrivi il modello su file usando pickle. Apri il file di destinazione usando la sintassi with open(____) as ____.
  • Ora carica il modello dal file in una variabile con un nome diverso, clf_from_file.
  • Salva le predizioni del modello caricato in una variabile preds.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Fit a random forest to the training set
clf = ____(____=42).____(
  X_train, y_train)

# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
    pickle.____(clf, file=file)

# Now load the model from file in the production environment
with ____ as file:
    clf_from_file = pickle.____(file)

# Predict the labels of the test dataset
preds = clf_from_file.____
Modifica ed esegui il codice