Calcular la accuracy
Ahora que has dividido tus datos en conjuntos de entrenamiento y prueba, puedes ajustar tu modelo con los datos de entrenamiento y luego predecir las etiquetas de los datos de prueba. Eso es lo que practicarás en este ejercicio.
Hasta ahora has usado Logistic Regression y Decision Trees. Aquí usarás un RandomForestClassifier, que puedes entender como un conjunto (ensemble) de Decision Trees que, por lo general, supera a un único Decision Tree.
Tu trabajo en los ejercicios anteriores se mantiene, y los conjuntos de entrenamiento y prueba están disponibles en las variables X_train, X_test, y_train y y_test.
Este ejercicio forma parte del curso
Marketing Analytics: Predicción de churn de clientes en Python
Instrucciones del ejercicio
- Importa
RandomForestClassifierdesklearn.ensemble. - Instancia un
RandomForestClassifiercomoclf. - Ajusta
clfa los datos de entrenamiento:X_trainyy_train. - Calcula la accuracy de
clfen los datos de prueba usando el método.score().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import RandomForestClassifier
# Instantiate the classifier
clf = ____
# Fit to the training data
# Compute accuracy
print(____.____(____, ____))