Classificador por Votação
Agora vamos combinar três modelos de Machine Learning em um só para melhorar nosso modelo de Random Forest de detecção de fraude. Você vai combinar nosso modelo usual de Random Forest, a Regressão Logística do exercício anterior e uma Árvore de Decisão simples. Você pode usar o atalho get_model_results() para ver o resultado imediato do modelo de ensemble.
Este exercício faz parte do curso
Detecção de Fraudes em Python
Instruções do exercício
- Importe o pacote do Voting Classifier.
- Defina os três modelos: use a Regressão Logística de antes, o Random Forest dos exercícios anteriores e uma Árvore de Decisão com pesos de classe balanceados.
- Defina o modelo de ensemble informando os três classificadores com seus respectivos rótulos.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the package
from sklearn.ensemble import ____
# Define the three classifiers to use in the ensemble
clf1 = LogisticRegression(class_weight={0:1, 1:15}, random_state=5)
clf2 = ____(class_weight={0:1, 1:12}, criterion='gini', max_depth=8, max_features='log2',
min_samples_leaf=10, n_estimators=30, n_jobs=-1, random_state=5)
clf3 = DecisionTreeClassifier(random_state=5, class_weight="____")
# Combine the classifiers in the ensemble model
ensemble_model = ____(estimators=[('lr', ____), ('rf', ____), ('dt', ____)], voting='hard')
# Get the results
get_model_results(X_train, y_train, X_test, y_test, ensemble_model)