Data verkennen
Voor je codeeropdrachten ga je de theorie die je zojuist zag toepassen op een nieuwe gegevensset. Deze gegevensset gaat over bankklanten en wordt gebruikt om te voorspellen of klanten in gebreke blijven met hun aflossingen.
Er zijn in R handige functies om snel een overzicht te krijgen van je gegevensset. Voor nu kijk je alleen naar summary() en str().
De benodigde packages zijn geladen en de gegevensset defaultData staat al in je werkomgeving.
Deze oefening maakt deel uit van de cursus
Machine Learning for Marketing Analytics in R
Oefeninstructies
- Gebruik
summary()enstr()om naar je data te kijken. - Zorg er ook voor dat je meer inzicht krijgt in de interessante variabele
PaymentDefaultdoor een staafdiagram van de twee niveaus te plotten.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Summary of data
___(defaultData)
# Look at data structure
___(defaultData)
# Analyze the balancedness of dependent variable
ggplot(___,aes(x = ___)) +
geom_histogram(stat = "count")