Construir y evaluar un árbol más grande

Anteriormente, creaste un sencillo árbol de decisión que utilizaba la puntuación crediticia del solicitante y el importe del préstamo solicitado para predecir el resultado del préstamo.

Lending Club dispone de información adicional sobre los solicitantes, como el estado de propiedad de la vivienda, la antigüedad en el empleo, la finalidad del préstamo y las quiebras anteriores, que puede ser útil para hacer predicciones más precisas.

Utilizando todos los datos disponibles de los solicitantes, construye un modelo de préstamo más sofisticado utilizando el conjunto de datos de entrenamiento aleatorio creado anteriormente. A continuación, utiliza este modelo para hacer predicciones sobre el conjunto de datos de prueba para estimar el rendimiento del modelo en futuras solicitudes de préstamo.

Se ha precargado el paquete rpart y se han creado los conjuntos de datos loans_train y loans_test.

Este ejercicio forma parte del curso

Aprendizaje supervisado en R: Clasificación

Ver curso

Instrucciones del ejercicio

Utiliza rpart() para construir un modelo de préstamo utilizando el conjunto de datos de entrenamiento y todos los predictores disponibles. De nuevo, deja el argumento de control.
Aplicando la función predict() al conjunto de datos de prueba, crea un vector de resultados predichos. No olvides el argumento type.
Crea un table() para comparar los valores previstos con los valores reales outcome.
Calcula la precisión de las predicciones utilizando la función mean().

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Grow a tree using all of the available applicant data
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))

# Make predictions on the test dataset
loans_test$pred <- ___

# Examine the confusion matrix
table(___, ___)

# Compute the accuracy on the test dataset
mean(___)

Editar y ejecutar código