ComenzarEmpieza gratis

Ajustar el número de características

Los hiperparámetros predeterminados de tus modelos no están optimizados para tus datos. El objetivo de la validación cruzada con búsqueda en cuadrícula (grid search) es identificar los hiperparámetros que llevan a un rendimiento óptimo del modelo. En el vídeo, viste cómo se ajustó el hiperparámetro n_estimators del random forest. Aquí practicarás el ajuste del hiperparámetro max_features. El hiperparámetro cv está establecido en 3 para que el código se ejecute rápido.

Hyperparameter Purpose
max_features Number of features for best split

Un random forest es un ensamblado de muchos árboles de decisión. El hiperparámetro n_estimators controla el número de árboles que se usarán en el bosque, mientras que el hiperparámetro max_features controla cuántas características debe considerar el random forest al buscar la mejor división en el árbol de decisión.

Ya tienes instanciado un clasificador random forest como clf.

Este ejercicio forma parte del curso

Marketing Analytics: Predicción de churn de clientes en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import GridSearchCV
Editar y ejecutar código