Calcular la accuracy

Ahora que has dividido tus datos en conjuntos de entrenamiento y prueba, puedes ajustar tu modelo con los datos de entrenamiento y luego predecir las etiquetas de los datos de prueba. Eso es lo que practicarás en este ejercicio.

Hasta ahora has usado Logistic Regression y Decision Trees. Aquí usarás un RandomForestClassifier, que puedes entender como un conjunto (ensemble) de Decision Trees que, por lo general, supera a un único Decision Tree.

Tu trabajo en los ejercicios anteriores se mantiene, y los conjuntos de entrenamiento y prueba están disponibles en las variables X_train, X_test, y_train y y_test.

Este ejercicio forma parte del curso

Marketing Analytics: Predicción de churn de clientes en Python

Ver curso

Instrucciones del ejercicio

Importa RandomForestClassifier de sklearn.ensemble.
Instancia un RandomForestClassifier como clf.
Ajusta clf a los datos de entrenamiento: X_train y y_train.
Calcula la accuracy de clf en los datos de prueba usando el método .score().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import RandomForestClassifier


# Instantiate the classifier
clf = ____

# Fit to the training data


# Compute accuracy
print(____.____(____, ____))

Editar y ejecutar código