Random Forest Classifier - deel 1
Laten we nu een eerste random forest classifier maken voor fraudedetectie. Hopelijk doe je het beter dan de basisnauwkeurigheid die je net berekende, die ongeveer 96% was. Dit model zal dienen als het "basismodel" dat je in de volgende oefeningen gaat proberen te verbeteren. We beginnen met het splitsen van de data in een test- en trainingset en het definiëren van het Random Forest-model. De beschikbare data zijn features X en labels y.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in Python
Oefeninstructies
- Importeer de random forest-classifier uit
sklearn. - Splits je features
Xen labelsyin een trainingset en een testset. Zet 30% apart als testset. - Ken de random forest-classifier toe aan
modelen laatrandom_stateop 5 staan. We stellen hier een random state in om resultaten tussen verschillende modellen te kunnen vergelijken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the random forest model from sklearn
from sklearn.ensemble import ____
# Split your data into training and test set
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=0)
# Define the model as the random forest
model = ____(random_state=5)