Costruire e valutare un albero più grande

In precedenza, hai creato un semplice albero decisionale che utilizzava il punteggio di credito del richiedente e l'importo del prestito richiesto per prevedere l'esito del prestito.

Lending Club dispone di ulteriori informazioni sui richiedenti, come lo stato di proprietà della casa, l'anzianità lavorativa, lo scopo del prestito e precedenti fallimenti, che possono essere utili per previsioni più accurate.

Usando tutti i dati disponibili sui richiedenti, costruisci un modello di concessione più sofisticato utilizzando il set di dati di training casuale creato in precedenza. Poi, usa questo modello per fare previsioni sul set di dati di testing per stimare le prestazioni del modello su future richieste di prestito.

Il pacchetto rpart è già stato caricato e i set di dati loans_train e loans_test sono stati creati.

Questo esercizio fa parte del corso

Apprendimento supervisionato in R: Classificazione

Visualizza corso

Istruzioni dell'esercizio

Usa rpart() per costruire un modello di prestito utilizzando il set di dati di training e tutti i predittori disponibili. Anche qui, lascia invariato l'argomento control.
Applicando la funzione predict() al set di dati di testing, crea un vettore di esiti previsti. Non dimenticare l'argomento type.
Crea una table() per confrontare i valori previsti con i valori outcome reali.
Calcola l'accuratezza delle previsioni usando la funzione mean().

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Grow a tree using all of the available applicant data
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))

# Make predictions on the test dataset
loans_test$pred <- ___

# Examine the confusion matrix
table(___, ___)

# Compute the accuracy on the test dataset
mean(___)

Modifica ed esegui il codice