In-sample fit beperkt model
Je hebt de nauwkeurigheid voor logitModelFull berekend. Het is heel belangrijk om dat voor al je modelkandidaten te doen.
Daarom is logitModelNew gespecificeerd en aanwezig in je omgeving.
Als je de waarden van de verschillende modellen met elkaar vergelijkt: als verschillende modellen dezelfde nauwkeurigheid hebben, kies dan altijd het model met minder verklarende variabelen.
Deze oefening maakt deel uit van de cursus
Machine Learning for Marketing Analytics in R
Oefeninstructies
Doe dezelfde stappen als in de vorige oefening voor het nieuwe model.
Gebruik
predict()om voor elke klant een kans te krijgen om zijn betaling te laten mislukken.Bereken daarna een confusion matrix met dezelfde drempel van 0,5 voor classificatie. Let op:
SDMToolskan niet meer van CRAN worden gedownload. Installeer het in plaats daarvan viaremotes::install_version("SDMTools", "1.1-221.2").Bereken de nauwkeurigheid van het beperkte model en vergelijk die met de nauwkeurigheid van het volledige model. Je gaat je analyse alleen voortzetten met het beste model.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate the accuracy for 'logitModelNew'
# Make prediction
defaultData$predNew <- predict(logitModelNew, type = ___, na.action = ___)
# Construct the in-sample confusion matrix
confMatrixModelNew <- confusion.matrix(defaultData$___,defaultData$___, threshold = ___)
confMatrixModelNew
# Calculate the accuracy...
accuracyNew <- sum(diag(___)) / ___(___)
accuracyNew
# and compare it to the full model's accuracy
accuracyFull