Pickle
Finalmente è il momento di portare in produzione il tuo primo modello. Si tratta di un classificatore random forest che userai come baseline, mentre lavori per sviluppare un'alternativa migliore. Hai a disposizione il classico split in training e test con i nomi X_train, X_test, y_train e y_test, oltre ai moduli RandomForestClassifier() e pickle, di cui ti serviranno i metodi .load() e .dump() per questo esercizio.
Questo esercizio fa parte del corso
Progettare workflow di Machine Learning in Python
Istruzioni dell'esercizio
- Allena un classificatore random forest sui dati. Fissa il seme casuale a 42 per garantire la riproducibilità dei risultati.
- Scrivi il modello su file usando pickle. Apri il file di destinazione usando la sintassi
with open(____) as ____. - Ora carica il modello dal file in una variabile con un nome diverso,
clf_from_file. - Salva le predizioni del modello caricato in una variabile
preds.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit a random forest to the training set
clf = ____(____=42).____(
X_train, y_train)
# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
pickle.____(clf, file=file)
# Now load the model from file in the production environment
with ____ as file:
clf_from_file = pickle.____(file)
# Predict the labels of the test dataset
preds = clf_from_file.____