Creare un albero ben potato
Fermare la crescita di un albero troppo presto può portarlo a ignorare alcuni aspetti dei dati o a perdere tendenze importanti che avrebbe potuto scoprire più avanti.
Con il post-pruning, puoi far crescere intenzionalmente un albero grande e complesso, per poi potarlo in seguito rendendolo più piccolo ed efficiente.
In questo esercizio avrai l'opportunità di costruire una visualizzazione delle prestazioni dell'albero rispetto alla complessità e usare queste informazioni per potare l'albero al livello appropriato.
Il pacchetto rpart è già caricato, insieme a loans_test e loans_train.
Questo esercizio fa parte del corso
Apprendimento supervisionato in R: Classificazione
Istruzioni dell'esercizio
- Usa tutte le variabili del richiedente e nessun pre-pruning per creare un albero eccessivamente complesso. Assicurati di impostare
cp = 0inrpart.control()per evitare il pre-pruning. - Crea un grafico della complessità usando
plotcp()sul modello. - In base al grafico della complessità, pota l'albero a una complessità di 0.0014 usando la funzione
prune()con l'albero e il parametro di complessità. - Confronta l'accuratezza dell'albero potato con l'accuratezza originale del 58.3%. Per calcolare l'accuratezza usa le funzioni
predict()emean().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Grow an overly complex tree
loan_model <- ___
# Examine the complexity plot
plotcp(___)
# Prune the tree
loan_model_pruned <- ___(___, cp = ___)
# Compute the accuracy of the pruned tree
loans_test$pred <- ___
mean(___)