Voting Classifier
Laten we nu drie Machine Learning-modellen combineren tot één om ons eerdere Random Forest-fraudedetectiemodel te verbeteren. Je combineert het gebruikelijke Random Forest-model met de Logistic Regression uit de vorige oefening en met een eenvoudige Decision Tree. Je kunt de snelkoppeling get_model_results() gebruiken om direct het resultaat van het ensemblemodel te zien.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in Python
Oefeninstructies
- Importeer het Voting Classifier-pakket.
- Definieer de drie modellen: gebruik de Logistic Regression van eerder, de Random Forest uit de vorige oefeningen en een Decision Tree met gebalanceerde klassegewichten.
- Definieer het ensemblemodel door de drie classifiers met hun respectieve labels als input te geven.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the package
from sklearn.ensemble import ____
# Define the three classifiers to use in the ensemble
clf1 = LogisticRegression(class_weight={0:1, 1:15}, random_state=5)
clf2 = ____(class_weight={0:1, 1:12}, criterion='gini', max_depth=8, max_features='log2',
min_samples_leaf=10, n_estimators=30, n_jobs=-1, random_state=5)
clf3 = DecisionTreeClassifier(random_state=5, class_weight="____")
# Combine the classifiers in the ensemble model
ensemble_model = ____(estimators=[('lr', ____), ('rf', ____), ('dt', ____)], voting='hard')
# Get the results
get_model_results(X_train, y_train, X_test, y_test, ensemble_model)