Ajuste in-sample do modelo restrito
Você calculou a acurácia para logitModelFull. É muito importante fazer isso com todos os seus modelos candidatos.
Portanto, logitModelNew já está especificado e disponível no seu ambiente.
Ao comparar os valores dos diferentes modelos entre si: caso modelos diferentes tenham a mesma acurácia, sempre escolha o modelo com menos variáveis explicativas.
Este exercício faz parte do curso
Machine Learning for Marketing Analytics in R
Instruções do exercício
Repita os mesmos passos do exercício anterior para o novo modelo.
Use
predict()para obter a probabilidade de cada cliente entrar em inadimplência.Em seguida, calcule uma matriz de confusão com o mesmo limiar de 0,5 para classificação. Observe que
SDMToolsnão pode mais ser baixado do CRAN. Em vez disso, instale-o viaremotes::install_version("SDMTools", "1.1-221.2").Calcule a acurácia do modelo restrito e compare com a acurácia do modelo completo. Você continuará sua análise apenas com o modelo superior.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the accuracy for 'logitModelNew'
# Make prediction
defaultData$predNew <- predict(logitModelNew, type = ___, na.action = ___)
# Construct the in-sample confusion matrix
confMatrixModelNew <- confusion.matrix(defaultData$___,defaultData$___, threshold = ___)
confMatrixModelNew
# Calculate the accuracy...
accuracyNew <- sum(diag(___)) / ___(___)
accuracyNew
# and compare it to the full model's accuracy
accuracyFull