Usando um pipeline
Agora que você tem o nosso pipeline definido, ou seja, combinando uma regressão logística com o método SMOTE, vamos executá-lo nos dados. Você pode tratar o pipeline como se fosse um único modelo de Machine Learning. Nossos dados X e y já estão definidos, e o pipeline foi definido no exercício anterior. Está curioso para ver os resultados do modelo? Vamos tentar!
Este exercício faz parte do curso
Detecção de Fraudes em Python
Instruções do exercício
- Separe os dados
Xeyem conjuntos de treino e teste. Reserve 30% dos dados para o conjunto de teste e defina orandom_statecomo zero. - Ajuste seu pipeline com os dados de treino e obtenha as previsões executando a função
pipeline.predict()sobre o nosso conjuntoX_test.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Split your data X and y, into a training and a test set and fit the pipeline onto the training data
X_train, X_test, y_train, y_test = ____
# Fit your pipeline onto your training set and obtain predictions by fitting the model onto the test data
pipeline.fit(____, ____)
predicted = pipeline.____(____)
# Obtain the results from the classification report and confusion matrix
print('Classifcation report:\n', classification_report(y_test, predicted))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)