Random Forest Classifier - deel 1

Laten we nu een eerste random forest classifier maken voor fraudedetectie. Hopelijk doe je het beter dan de basisnauwkeurigheid die je net berekende, die ongeveer 96% was. Dit model zal dienen als het "basismodel" dat je in de volgende oefeningen gaat proberen te verbeteren. We beginnen met het splitsen van de data in een test- en trainingset en het definiëren van het Random Forest-model. De beschikbare data zijn features X en labels y.

Deze oefening maakt deel uit van de cursus

Fraudedetectie in Python

Bekijk cursus

Oefeninstructies

Importeer de random forest-classifier uit sklearn.
Splits je features X en labels y in een trainingset en een testset. Zet 30% apart als testset.
Ken de random forest-classifier toe aan model en laat random_state op 5 staan. We stellen hier een random state in om resultaten tussen verschillende modellen te kunnen vergelijken.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import the random forest model from sklearn
from sklearn.ensemble import ____

# Split your data into training and test set
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=0)

# Define the model as the random forest
model = ____(random_state=5)

Code bewerken en uitvoeren