Evitando árvores superdimensionadas
A árvore treinada com todo o conjunto de dados de solicitantes ficou extremamente grande e complexa, com centenas de divisões e nós folha contendo apenas alguns poucos solicitantes. Essa árvore seria quase impossível de interpretar por um analista de crédito.
Usando métodos de pré-poda (interrupção antecipada), você pode evitar que a árvore cresça demais e fique complexa. Veja como as opções de controle do rpart para profundidade máxima da árvore e contagem mínima para divisão afetam a árvore resultante.
Os conjuntos loans_train e loans_test já foram criados, e rpart já está pré-carregado.
Este exercício faz parte do curso
Aprendizagem supervisionada em R: Classificação
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Grow a tree with maxdepth of 6
loan_model <- ___
# Make a class prediction on the test set
loans_test$pred <- ___
# Compute the accuracy of the simpler tree
mean(___)