In-sample fit beperkt model

Je hebt de nauwkeurigheid voor logitModelFull berekend. Het is heel belangrijk om dat voor al je modelkandidaten te doen.

Daarom is logitModelNew gespecificeerd en aanwezig in je omgeving.

Als je de waarden van de verschillende modellen met elkaar vergelijkt: als verschillende modellen dezelfde nauwkeurigheid hebben, kies dan altijd het model met minder verklarende variabelen.

Deze oefening maakt deel uit van de cursus

Machine Learning for Marketing Analytics in R

Bekijk cursus

Oefeninstructies

Doe dezelfde stappen als in de vorige oefening voor het nieuwe model.
Gebruik predict() om voor elke klant een kans te krijgen om zijn betaling te laten mislukken.
Bereken daarna een confusion matrix met dezelfde drempel van 0,5 voor classificatie. Let op: SDMTools kan niet meer van CRAN worden gedownload. Installeer het in plaats daarvan via remotes::install_version("SDMTools", "1.1-221.2").
Bereken de nauwkeurigheid van het beperkte model en vergelijk die met de nauwkeurigheid van het volledige model. Je gaat je analyse alleen voortzetten met het beste model.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Calculate the accuracy for 'logitModelNew'
# Make prediction
defaultData$predNew <- predict(logitModelNew, type = ___, na.action = ___)

# Construct the in-sample confusion matrix
confMatrixModelNew <- confusion.matrix(defaultData$___,defaultData$___, threshold = ___)
confMatrixModelNew

# Calculate the accuracy...
accuracyNew <- sum(diag(___)) / ___(___)
accuracyNew

# and compare it to the full model's accuracy
accuracyFull

Code bewerken en uitvoeren