Pickles
Il est enfin temps de mettre votre premier modèle en production. Il s’agit d’un classifieur random forest que vous utiliserez comme référence, pendant que vous travaillez encore à développer une meilleure alternative. Vous avez accès à la séparation entraînement/test avec leurs noms usuels : X_train, X_test, y_train et y_test, ainsi qu’aux modules RandomForestClassifier() et pickle, dont vous aurez besoin des méthodes .load() et .dump() pour cet exercice.
Cet exercice fait partie du cours
<cours>Concevoir des workflows de Machine Learning en Python</cours>Instructions de l’exercice
- Entraînez un classifieur random forest sur les données. Fixez la graine aléatoire à 42 pour garantir la reproductibilité de vos résultats.
- Écrivez le modèle dans un fichier avec pickle. Ouvrez le fichier de destination en utilisant la syntaxe
with open(____) as ____. - Chargez maintenant le modèle depuis le fichier dans une autre variable,
clf_from_file. - Stockez les prédictions du modèle chargé dans une variable
preds.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Fit a random forest to the training set
clf = ____(____=42).____(
X_train, y_train)
# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
pickle.____(clf, file=file)
# Now load the model from file in the production environment
with ____ as file:
clf_from_file = pickle.____(file)
# Predict the labels of the test dataset
preds = clf_from_file.____