ComeçarComece de graça

Evitando árvores superdimensionadas

A árvore treinada com todo o conjunto de dados de solicitantes ficou extremamente grande e complexa, com centenas de divisões e nós folha contendo apenas alguns poucos solicitantes. Essa árvore seria quase impossível de interpretar por um analista de crédito.

Usando métodos de pré-poda (interrupção antecipada), você pode evitar que a árvore cresça demais e fique complexa. Veja como as opções de controle do rpart para profundidade máxima da árvore e contagem mínima para divisão afetam a árvore resultante.

Os conjuntos loans_train e loans_test já foram criados, e rpart já está pré-carregado.

Este exercício faz parte do curso

Aprendizagem supervisionada em R: Classificação

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Grow a tree with maxdepth of 6
loan_model <- ___

# Make a class prediction on the test set
loans_test$pred <- ___

# Compute the accuracy of the simpler tree
mean(___)
Editar e executar o código