ComeçarComece gratuitamente

Criação e avaliação de uma árvore maior

Anteriormente, você criou uma árvore de decisão simples que usava a pontuação de crédito do candidato e o valor do empréstimo solicitado para prever o resultado do empréstimo.

O Lending Club tem informações adicionais sobre os candidatos, como status de propriedade da casa, tempo de emprego, finalidade do empréstimo e falências anteriores, que podem ser úteis para fazer previsões mais precisas.

Usando todos os dados disponíveis do candidato, crie um modelo de empréstimo mais sofisticado usando o conjunto de dados de treinamento aleatório criado anteriormente. Em seguida, use esse modelo para fazer previsões no conjunto de dados de teste para estimar o desempenho do modelo em futuros pedidos de empréstimo.

O pacote rpart foi pré-carregado e os conjuntos de dados loans_train e loans_test foram criados.

Este exercício faz parte do curso

Aprendizagem supervisionada em R: Classificação

Ver Curso

Instruções de exercício

  • Use o site rpart() para criar um modelo de empréstimo usando o conjunto de dados de treinamento e todos os preditores disponíveis. Novamente, deixe o argumento do control de lado.
  • Ao aplicar a função predict() ao conjunto de dados de teste, você cria um vetor de resultados previstos. Não se esqueça do argumento type.
  • Crie um table() para comparar os valores previstos com os valores reais do outcome.
  • Calcule a precisão das previsões usando a função mean().

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Grow a tree using all of the available applicant data
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))

# Make predictions on the test dataset
loans_test$pred <- ___

# Examine the confusion matrix
table(___, ___)

# Compute the accuracy on the test dataset
mean(___)
Editar e executar código