Criando uma árvore bem podada
Impedir que uma árvore cresça completamente pode fazer com que ela ignore alguns aspectos dos dados ou deixe passar tendências importantes que podem ser descobertas posteriormente.
Ao usar a pós-poda, você pode intencionalmente cultivar uma árvore grande e complexa e, depois, podá-la para que fique menor e mais eficiente.
Neste exercício, você terá a oportunidade de construir uma visualização do desempenho da árvore em relação à complexidade e usar essas informações para podar a árvore até um nível adequado.
O pacote rpart
foi pré-carregado, juntamente com loans_test
e loans_train
.
Este exercício faz parte do curso
Aprendizagem supervisionada em R: Classificação
Instruções de exercício
- Use todas as variáveis candidatas e nenhuma poda prévia para criar uma árvore excessivamente complexa. Certifique-se de definir
cp = 0
emrpart.control()
para evitar a pré-poda. - Crie um gráfico de complexidade usando o site
plotcp()
no modelo. - Com base no gráfico de complexidade, podar a árvore para uma complexidade de 0,0014 usando a função
prune()
com a árvore e o parâmetro de complexidade. - Compare a precisão da árvore podada com a precisão original de 58,3%. Para calcular a precisão, use as funções
predict()
emean()
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Grow an overly complex tree
loan_model <- ___
# Examine the complexity plot
plotcp(___)
# Prune the tree
loan_model_pruned <- ___(___, cp = ___)
# Compute the accuracy of the pruned tree
loans_test$pred <- ___
mean(___)