La tua prima pipeline
Una tua collega ha usato AdaBoostClassifier per l’insieme di dati di credit scoring. Vuoi provare anche un classificatore random forest. In questo esercizio, adatterai questo classificatore ai dati e lo confronterai con AdaBoostClassifier. Assicurati di usare uno split train/test per evitare overfitting. I dati sono già caricati e trasformati in modo che tutte le feature siano numeriche. Le feature sono disponibili come X e le etichette come y. Anche il modulo RandomForestClassifier è già caricato.
Questo esercizio fa parte del corso
Progettare workflow di Machine Learning in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Split the data into train and test, with 20% as test
X_train, ____, ____, y_test = train_test_split(
X, y, ____=0.2, random_state=1)