Ausreißer mit Kreuztabellen finden
Jetzt sollst du Ausreißer finden und entfernen, die sich vermutlich in den Daten befinden. Für diese Übung kannst du Kreuztabellen und Aggregatfunktionen verwenden.
Schau dir die Spalte person_emp_length an. Du hast das Argument aggfunc = 'mean' bereits genutzt, um den Durchschnitt einer numerischen Spalte zu sehen. Um Ausreißer zu erkennen, kannst du jedoch auch andere Funktionen wie min und max verwenden.
Es ist eher unwahrscheinlich, dass jemand eine Beschäftigungsdauer von weniger als 0 oder mehr als 60 hat. Mit Kreuztabellen kannst du die Daten prüfen und sehen, ob es solche Fälle gibt!
Der Datensatz cr_loan wurde bereits in den Workspace geladen.
Diese Übung ist Teil des Kurses
Kreditrisikomodellierung in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the cross table for loan status, home ownership, and the max employment length
print(pd.____(cr_loan[____],cr_loan[____],
values=cr_loan[____], aggfunc=____))