LoslegenKostenlos loslegen

Daten erkunden

In den Programmierübungen wendest du die eben gesehene Theorie auf einen neuen Datensatz an. Dieser Datensatz betrifft Bankkundinnen und -kunden und wird genutzt, um vorherzusagen, ob sie mit ihren Kreditrückzahlungen in Verzug geraten.

In R gibt es sehr hilfreiche Funktionen, um sich schnell einen Überblick über einen Datensatz zu verschaffen. Für den Moment schaust du dir nur summary() und str() an.

Die nötigen Pakete sind geladen und der Datensatz defaultData steht in deiner Arbeitsumgebung bereit.

Diese Übung ist Teil des Kurses

Machine Learning für Marketing-Analytics in R

Kurs anzeigen

Anleitung zur Übung

  • Nutze summary() und str(), um dir die Daten anzusehen.
  • Verschaffe dir außerdem mehr Einblicke in die Zielvariable PaymentDefault, indem du ein Balkendiagramm der beiden Ausprägungen zeichnest.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Summary of data
___(defaultData)

# Look at data structure
___(defaultData)

# Analyze the balancedness of dependent variable
ggplot(___,aes(x = ___)) +
  geom_histogram(stat = "count") 
Code bearbeiten und ausführen