Evitar árboles sobredimensionados
El árbol entrenado con todo el conjunto de datos de solicitantes creció muchísimo y se volvió muy complejo, con cientos de divisiones y hojas que contenían solo a unos pocos solicitantes. Este árbol sería casi imposible de interpretar para un/a agente de préstamos.
Usando métodos de pre-poda (parada temprana), puedes evitar que un árbol crezca demasiado y se complique en exceso. Observa cómo las opciones de control de rpart para la profundidad máxima del árbol y el número mínimo de observaciones para dividir afectan al árbol resultante.
Los conjuntos loans_train y loans_test ya están creados, y rpart está precargado.
Este ejercicio forma parte del curso
Aprendizaje supervisado en R: Clasificación
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Grow a tree with maxdepth of 6
loan_model <- ___
# Make a class prediction on the test set
loans_test$pred <- ___
# Compute the accuracy of the simpler tree
mean(___)