ComenzarEmpieza gratis

Tu primer pipeline

Tu compañera ha usado AdaBoostClassifier para el conjunto de datos de credit scoring. Tú también quieres probar un clasificador de random forest. En este ejercicio, ajustarás este clasificador a los datos y lo compararás con AdaBoostClassifier. Asegúrate de usar una división train/test para evitar el sobreajuste. Los datos están precargados y transformados para que todas las variables sean numéricas. Las variables están disponibles como X y las etiquetas como y. El módulo RandomForestClassifier también está precargado.

Este ejercicio forma parte del curso

Diseño de flujos de trabajo de Machine Learning en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Split the data into train and test, with 20% as test
X_train, ____, ____, y_test = train_test_split(
  X, y, ____=0.2, random_state=1)
Editar y ejecutar código