Criação e avaliação de uma árvore maior
Anteriormente, você criou uma árvore de decisão simples que usava a pontuação de crédito do candidato e o valor do empréstimo solicitado para prever o resultado do empréstimo.
O Lending Club tem informações adicionais sobre os candidatos, como status de propriedade da casa, tempo de emprego, finalidade do empréstimo e falências anteriores, que podem ser úteis para fazer previsões mais precisas.
Usando todos os dados disponíveis do candidato, crie um modelo de empréstimo mais sofisticado usando o conjunto de dados de treinamento aleatório criado anteriormente. Em seguida, use esse modelo para fazer previsões no conjunto de dados de teste para estimar o desempenho do modelo em futuros pedidos de empréstimo.
O pacote rpart
foi pré-carregado e os conjuntos de dados loans_train
e loans_test
foram criados.
Este exercício faz parte do curso
Aprendizagem supervisionada em R: Classificação
Instruções de exercício
- Use o site
rpart()
para criar um modelo de empréstimo usando o conjunto de dados de treinamento e todos os preditores disponíveis. Novamente, deixe o argumento docontrol
de lado. - Ao aplicar a função
predict()
ao conjunto de dados de teste, você cria um vetor de resultados previstos. Não se esqueça do argumentotype
. - Crie um
table()
para comparar os valores previstos com os valores reais dooutcome
. - Calcule a precisão das previsões usando a função
mean()
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Grow a tree using all of the available applicant data
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))
# Make predictions on the test dataset
loans_test$pred <- ___
# Examine the confusion matrix
table(___, ___)
# Compute the accuracy on the test dataset
mean(___)