Seu primeiro pipeline
Sua colega usou AdaBoostClassifier no conjunto de dados de crédito. Você também quer testar um classificador random forest. Neste exercício, você vai ajustar esse classificador aos dados e compará-lo com o AdaBoostClassifier. Lembre-se de usar a divisão em treino/teste para evitar overfitting. Os dados já estão pré-carregados e transformados para que todos os recursos sejam numéricos. As features estão em X e os rótulos em y. O módulo RandomForestClassifier também já foi pré-carregado.
Este exercício faz parte do curso
Projetando Workflows de Machine Learning em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Split the data into train and test, with 20% as test
X_train, ____, ____, y_test = train_test_split(
X, y, ____=0.2, random_state=1)