Daten erkunden
In den Programmierübungen wendest du die eben gesehene Theorie auf einen neuen Datensatz an. Dieser Datensatz betrifft Bankkundinnen und -kunden und wird genutzt, um vorherzusagen, ob sie mit ihren Kreditrückzahlungen in Verzug geraten.
In R gibt es sehr hilfreiche Funktionen, um sich schnell einen Überblick über einen Datensatz zu verschaffen. Für den Moment schaust du dir nur summary() und str() an.
Die nötigen Pakete sind geladen und der Datensatz defaultData steht in deiner Arbeitsumgebung bereit.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing-Analytics in R
Anleitung zur Übung
- Nutze
summary()undstr(), um dir die Daten anzusehen. - Verschaffe dir außerdem mehr Einblicke in die Zielvariable
PaymentDefault, indem du ein Balkendiagramm der beiden Ausprägungen zeichnest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Summary of data
___(defaultData)
# Look at data structure
___(defaultData)
# Analyze the balancedness of dependent variable
ggplot(___,aes(x = ___)) +
geom_histogram(stat = "count")