Pickles
Finalmente, é hora de colocar seu primeiro modelo em produção. É um classificador de random forest que você usará como baseline enquanto ainda trabalha para desenvolver uma alternativa melhor. Você tem acesso à divisão dos dados em treino e teste com seus nomes usuais, X_train, X_test, y_train e y_test, bem como aos módulos RandomForestClassifier() e pickle, cujos métodos .load() e .dump() você vai precisar neste exercício.
Este exercício faz parte do curso
Projetando Workflows de Machine Learning em Python
Instruções do exercício
- Ajuste um classificador de random forest aos dados. Fixe a semente aleatória em 42 para garantir que seus resultados sejam reprodutíveis.
- Escreva o modelo em um arquivo usando pickle. Abra o arquivo de destino usando a sintaxe
with open(____) as ____. - Agora carregue o modelo do arquivo em uma variável com nome diferente,
clf_from_file. - Armazene as previsões do modelo que você carregou em uma variável
preds.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit a random forest to the training set
clf = ____(____=42).____(
X_train, y_train)
# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
pickle.____(clf, file=file)
# Now load the model from file in the production environment
with ____ as file:
clf_from_file = pickle.____(file)
# Predict the labels of the test dataset
preds = clf_from_file.____