CommencerCommencer gratuitement

Pickles

Il est enfin temps de mettre votre premier modèle en production. Il s’agit d’un classifieur random forest que vous utiliserez comme référence, pendant que vous travaillez encore à développer une meilleure alternative. Vous avez accès à la séparation entraînement/test avec leurs noms usuels : X_train, X_test, y_train et y_test, ainsi qu’aux modules RandomForestClassifier() et pickle, dont vous aurez besoin des méthodes .load() et .dump() pour cet exercice.

Cet exercice fait partie du cours

Concevoir des workflows de Machine Learning en Python

Afficher le cours

Instructions

  • Entraînez un classifieur random forest sur les données. Fixez la graine aléatoire à 42 pour garantir la reproductibilité de vos résultats.
  • Écrivez le modèle dans un fichier avec pickle. Ouvrez le fichier de destination en utilisant la syntaxe with open(____) as ____.
  • Chargez maintenant le modèle depuis le fichier dans une autre variable, clf_from_file.
  • Stockez les prédictions du modèle chargé dans une variable preds.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Fit a random forest to the training set
clf = ____(____=42).____(
  X_train, y_train)

# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
    pickle.____(clf, file=file)

# Now load the model from file in the production environment
with ____ as file:
    clf_from_file = pickle.____(file)

# Predict the labels of the test dataset
preds = clf_from_file.____
Modifier et exécuter le code