ComeçarComece gratuitamente

Criando uma árvore bem podada

Impedir que uma árvore cresça completamente pode fazer com que ela ignore alguns aspectos dos dados ou deixe passar tendências importantes que podem ser descobertas posteriormente.

Ao usar a pós-poda, você pode intencionalmente cultivar uma árvore grande e complexa e, depois, podá-la para que fique menor e mais eficiente.

Neste exercício, você terá a oportunidade de construir uma visualização do desempenho da árvore em relação à complexidade e usar essas informações para podar a árvore até um nível adequado.

O pacote rpart foi pré-carregado, juntamente com loans_test e loans_train.

Este exercício faz parte do curso

Aprendizagem supervisionada em R: Classificação

Ver Curso

Instruções de exercício

  • Use todas as variáveis candidatas e nenhuma poda prévia para criar uma árvore excessivamente complexa. Certifique-se de definir cp = 0 em rpart.control() para evitar a pré-poda.
  • Crie um gráfico de complexidade usando o site plotcp() no modelo.
  • Com base no gráfico de complexidade, podar a árvore para uma complexidade de 0,0014 usando a função prune() com a árvore e o parâmetro de complexidade.
  • Compare a precisão da árvore podada com a precisão original de 58,3%. Para calcular a precisão, use as funções predict() e mean().

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Grow an overly complex tree
loan_model <- ___

# Examine the complexity plot
plotcp(___)

# Prune the tree
loan_model_pruned <- ___(___, cp = ___)

# Compute the accuracy of the pruned tree
loans_test$pred <- ___
mean(___)
Editar e executar código