CommencerCommencez gratuitement

Pickles

Il est enfin temps de mettre votre premier modèle en production. Il s’agit d’un classifieur random forest que vous utiliserez comme référence, pendant que vous travaillez encore à développer une meilleure alternative. Vous avez accès à la séparation entraînement/test avec leurs noms usuels : X_train, X_test, y_train et y_test, ainsi qu’aux modules RandomForestClassifier() et pickle, dont vous aurez besoin des méthodes .load() et .dump() pour cet exercice.

Cet exercice fait partie du cours

<cours>Concevoir des workflows de Machine Learning en Python</cours>
Voir le cours

Instructions de l’exercice

  • Entraînez un classifieur random forest sur les données. Fixez la graine aléatoire à 42 pour garantir la reproductibilité de vos résultats.
  • Écrivez le modèle dans un fichier avec pickle. Ouvrez le fichier de destination en utilisant la syntaxe with open(____) as ____.
  • Chargez maintenant le modèle depuis le fichier dans une autre variable, clf_from_file.
  • Stockez les prédictions du modèle chargé dans une variable preds.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Fit a random forest to the training set
clf = ____(____=42).____(
  X_train, y_train)

# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
    pickle.____(clf, file=file)

# Now load the model from file in the production environment
with ____ as file:
    clf_from_file = pickle.____(file)

# Predict the labels of the test dataset
preds = clf_from_file.____
Modifier et exécuter le code