Random Forest Classifier - parte 1
Creiamo ora un primo random forest classifier per il rilevamento delle frodi. Speriamo tu possa fare meglio dell'accuratezza di base che hai appena calcolato, circa 96%. Questo modello fungerà da modello di "baseline" che cercherai di migliorare nei prossimi esercizi. Iniziamo suddividendo i dati in un insieme di training e uno di test e definendo il modello Random Forest. I dati disponibili sono le feature X e le etichette y.
Questo esercizio fa parte del corso
Rilevamento delle frodi in Python
Istruzioni dell'esercizio
- Importa il random forest classifier da
sklearn. - Suddividi le feature
Xe le etichetteyin un insieme di training e uno di test. Metti da parte un test set del 30%. - Assegna il random forest classifier a
modele mantienirandom_statea 5. Dobbiamo impostare un random state per poter confrontare i risultati tra modelli diversi.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the random forest model from sklearn
from sklearn.ensemble import ____
# Split your data into training and test set
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=0)
# Define the model as the random forest
model = ____(random_state=5)