Aan de slagGa gratis aan de slag

Data verkennen

Voor je codeeropdrachten ga je de theorie die je zojuist zag toepassen op een nieuwe gegevensset. Deze gegevensset gaat over bankklanten en wordt gebruikt om te voorspellen of klanten in gebreke blijven met hun aflossingen.

Er zijn in R handige functies om snel een overzicht te krijgen van je gegevensset. Voor nu kijk je alleen naar summary() en str().

De benodigde packages zijn geladen en de gegevensset defaultData staat al in je werkomgeving.

Deze oefening maakt deel uit van de cursus

Machine Learning for Marketing Analytics in R

Cursus bekijken

Oefeninstructies

  • Gebruik summary() en str() om naar je data te kijken.
  • Zorg er ook voor dat je meer inzicht krijgt in de interessante variabele PaymentDefault door een staafdiagram van de twee niveaus te plotten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Summary of data
___(defaultData)

# Look at data structure
___(defaultData)

# Analyze the balancedness of dependent variable
ggplot(___,aes(x = ___)) +
  geom_histogram(stat = "count") 
Code bewerken en uitvoeren