Aan de slagGa gratis aan de slag

In-sample fit beperkt model

Je hebt de nauwkeurigheid voor logitModelFull berekend. Het is heel belangrijk om dat voor al je modelkandidaten te doen.

Daarom is logitModelNew gespecificeerd en aanwezig in je omgeving.

Als je de waarden van de verschillende modellen met elkaar vergelijkt: als verschillende modellen dezelfde nauwkeurigheid hebben, kies dan altijd het model met minder verklarende variabelen.

Deze oefening maakt deel uit van de cursus

Machine Learning for Marketing Analytics in R

Cursus bekijken

Oefeninstructies

  • Doe dezelfde stappen als in de vorige oefening voor het nieuwe model.

  • Gebruik predict() om voor elke klant een kans te krijgen om zijn betaling te laten mislukken.

  • Bereken daarna een confusion matrix met dezelfde drempel van 0,5 voor classificatie. Let op: SDMTools kan niet meer van CRAN worden gedownload. Installeer het in plaats daarvan via remotes::install_version("SDMTools", "1.1-221.2").

  • Bereken de nauwkeurigheid van het beperkte model en vergelijk die met de nauwkeurigheid van het volledige model. Je gaat je analyse alleen voortzetten met het beste model.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Calculate the accuracy for 'logitModelNew'
# Make prediction
defaultData$predNew <- predict(logitModelNew, type = ___, na.action = ___)

# Construct the in-sample confusion matrix
confMatrixModelNew <- confusion.matrix(defaultData$___,defaultData$___, threshold = ___)
confMatrixModelNew

# Calculate the accuracy...
accuracyNew <- sum(diag(___)) / ___(___)
accuracyNew

# and compare it to the full model's accuracy
accuracyFull
Code bewerken en uitvoeren