LoslegenKostenlos loslegen

Ausreißer mit Kreuztabellen finden

Jetzt sollst du Ausreißer finden und entfernen, die sich vermutlich in den Daten befinden. Für diese Übung kannst du Kreuztabellen und Aggregatfunktionen verwenden.

Schau dir die Spalte person_emp_length an. Du hast das Argument aggfunc = 'mean' bereits genutzt, um den Durchschnitt einer numerischen Spalte zu sehen. Um Ausreißer zu erkennen, kannst du jedoch auch andere Funktionen wie min und max verwenden.

Es ist eher unwahrscheinlich, dass jemand eine Beschäftigungsdauer von weniger als 0 oder mehr als 60 hat. Mit Kreuztabellen kannst du die Daten prüfen und sehen, ob es solche Fälle gibt!

Der Datensatz cr_loan wurde bereits in den Workspace geladen.

Diese Übung ist Teil des Kurses

Kreditrisikomodellierung in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create the cross table for loan status, home ownership, and the max employment length
print(pd.____(cr_loan[____],cr_loan[____],
        values=cr_loan[____], aggfunc=____))
Code bearbeiten und ausführen