Construir y evaluar un árbol más grande
Anteriormente, creaste un sencillo árbol de decisión que utilizaba la puntuación crediticia del solicitante y el importe del préstamo solicitado para predecir el resultado del préstamo.
Lending Club dispone de información adicional sobre los solicitantes, como el estado de propiedad de la vivienda, la antigüedad en el empleo, la finalidad del préstamo y las quiebras anteriores, que puede ser útil para hacer predicciones más precisas.
Utilizando todos los datos disponibles de los solicitantes, construye un modelo de préstamo más sofisticado utilizando el conjunto de datos de entrenamiento aleatorio creado anteriormente. A continuación, utiliza este modelo para hacer predicciones sobre el conjunto de datos de prueba para estimar el rendimiento del modelo en futuras solicitudes de préstamo.
Se ha precargado el paquete rpart
y se han creado los conjuntos de datos loans_train
y loans_test
.
Este ejercicio forma parte del curso
Aprendizaje supervisado en R: Clasificación
Instrucciones de ejercicio
- Utiliza
rpart()
para construir un modelo de préstamo utilizando el conjunto de datos de entrenamiento y todos los predictores disponibles. De nuevo, deja el argumento decontrol
. - Aplicando la función
predict()
al conjunto de datos de prueba, crea un vector de resultados predichos. No olvides el argumentotype
. - Crea un
table()
para comparar los valores previstos con los valores realesoutcome
. - Calcula la precisión de las predicciones utilizando la función
mean()
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Grow a tree using all of the available applicant data
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))
# Make predictions on the test dataset
loans_test$pred <- ___
# Examine the confusion matrix
table(___, ___)
# Compute the accuracy on the test dataset
mean(___)