Crear un árbol bien podado
Impedir que un árbol crezca hasta el final puede llevarle a ignorar algunos aspectos de los datos o a pasar por alto tendencias importantes que podría haber descubierto más tarde.
Mediante la poda posterior, puedes hacer crecer intencionadamente un árbol grande y complejo y luego podarlo para que sea más pequeño y eficiente más adelante.
En este ejercicio, tendrás la oportunidad de construir una visualización del rendimiento del árbol frente a la complejidad, y utilizar esta información para podar el árbol hasta un nivel adecuado.
Se ha precargado el paquete rpart
, junto con loans_test
y loans_train
.
Este ejercicio forma parte del curso
Aprendizaje supervisado en R: Clasificación
Instrucciones de ejercicio
- Utiliza todas las variables del solicitante y no realices ninguna poda previa para crear un árbol demasiado complejo. Asegúrate de poner
cp = 0
enrpart.control()
para evitar la prepoda. - Crea un gráfico de complejidad utilizando
plotcp()
en el modelo. - Basándote en el gráfico de complejidad, poda el árbol hasta una complejidad de 0,0014 utilizando la función
prune()
con el árbol y el parámetro de complejidad. - Compara la precisión del árbol podado con la precisión original del 58,3%. Para calcular la precisión utiliza las funciones
predict()
ymean()
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Grow an overly complex tree
loan_model <- ___
# Examine the complexity plot
plotcp(___)
# Prune the tree
loan_model_pruned <- ___(___, cp = ___)
# Compute the accuracy of the pruned tree
loans_test$pred <- ___
mean(___)