ComenzarEmpieza gratis

Evitar árboles sobredimensionados

El árbol entrenado con todo el conjunto de datos de solicitantes creció muchísimo y se volvió muy complejo, con cientos de divisiones y hojas que contenían solo a unos pocos solicitantes. Este árbol sería casi imposible de interpretar para un/a agente de préstamos.

Usando métodos de pre-poda (parada temprana), puedes evitar que un árbol crezca demasiado y se complique en exceso. Observa cómo las opciones de control de rpart para la profundidad máxima del árbol y el número mínimo de observaciones para dividir afectan al árbol resultante.

Los conjuntos loans_train y loans_test ya están creados, y rpart está precargado.

Este ejercicio forma parte del curso

Aprendizaje supervisado en R: Clasificación

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Grow a tree with maxdepth of 6
loan_model <- ___

# Make a class prediction on the test set
loans_test$pred <- ___

# Compute the accuracy of the simpler tree
mean(___)
Editar y ejecutar código