ComeçarComece de graça

Pickles

Finalmente, é hora de colocar seu primeiro modelo em produção. É um classificador de random forest que você usará como baseline enquanto ainda trabalha para desenvolver uma alternativa melhor. Você tem acesso à divisão dos dados em treino e teste com seus nomes usuais, X_train, X_test, y_train e y_test, bem como aos módulos RandomForestClassifier() e pickle, cujos métodos .load() e .dump() você vai precisar neste exercício.

Este exercício faz parte do curso

Projetando Workflows de Machine Learning em Python

Ver curso

Instruções do exercício

  • Ajuste um classificador de random forest aos dados. Fixe a semente aleatória em 42 para garantir que seus resultados sejam reprodutíveis.
  • Escreva o modelo em um arquivo usando pickle. Abra o arquivo de destino usando a sintaxe with open(____) as ____.
  • Agora carregue o modelo do arquivo em uma variável com nome diferente, clf_from_file.
  • Armazene as previsões do modelo que você carregou em uma variável preds.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Fit a random forest to the training set
clf = ____(____=42).____(
  X_train, y_train)

# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
    pickle.____(clf, file=file)

# Now load the model from file in the production environment
with ____ as file:
    clf_from_file = pickle.____(file)

# Predict the labels of the test dataset
preds = clf_from_file.____
Editar e executar o código