Aan de slagGa gratis aan de slag

Voting Classifier

Laten we nu drie Machine Learning-modellen combineren tot één om ons eerdere Random Forest-fraudedetectiemodel te verbeteren. Je combineert het gebruikelijke Random Forest-model met de Logistic Regression uit de vorige oefening en met een eenvoudige Decision Tree. Je kunt de snelkoppeling get_model_results() gebruiken om direct het resultaat van het ensemblemodel te zien.

Deze oefening maakt deel uit van de cursus

Fraudedetectie in Python

Cursus bekijken

Oefeninstructies

  • Importeer het Voting Classifier-pakket.
  • Definieer de drie modellen: gebruik de Logistic Regression van eerder, de Random Forest uit de vorige oefeningen en een Decision Tree met gebalanceerde klassegewichten.
  • Definieer het ensemblemodel door de drie classifiers met hun respectieve labels als input te geven.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the package
from sklearn.ensemble import ____

# Define the three classifiers to use in the ensemble
clf1 = LogisticRegression(class_weight={0:1, 1:15}, random_state=5)
clf2 = ____(class_weight={0:1, 1:12}, criterion='gini', max_depth=8, max_features='log2',
            min_samples_leaf=10, n_estimators=30, n_jobs=-1, random_state=5)
clf3 = DecisionTreeClassifier(random_state=5, class_weight="____")

# Combine the classifiers in the ensemble model
ensemble_model = ____(estimators=[('lr', ____), ('rf', ____), ('dt', ____)], voting='hard')

# Get the results 
get_model_results(X_train, y_train, X_test, y_test, ensemble_model)
Code bewerken en uitvoeren