Fehlende Daten entfernen
Du hast fehlende Daten in person_emp_length ersetzt, aber in der vorherigen Übung hast du gesehen, dass loan_int_rate ebenfalls fehlende Werte enthält.
Ähnlich wie bei fehlenden Daten in loan_status erschweren fehlende Daten in loan_int_rate die Vorhersagen.
Da die Zinssätze von deinem Unternehmen festgelegt werden, ist es sehr ungewöhnlich, dass in dieser Spalte Werte fehlen. Möglich, dass Probleme bei der Datenaufnahme zu Fehlern geführt haben, aber sicher weißt du es nicht. Für den Moment ist es am besten, diese Einträge mit .drop() zu entfernen, bevor du weitermachst.
Der Datensatz cr_loan wurde in den Workspace geladen.
Diese Übung ist Teil des Kurses
Kreditrisikomodellierung in Python
Anleitung zur Übung
- Gib die Anzahl der Einträge aus, die fehlende Daten für den Zinssatz enthalten.
- Erstelle ein Array mit den Indizes der Zeilen mit fehlendem Zinssatz und nenne es indices.
- Entferne die Einträge mit fehlendem Zinssatz und speichere das Ergebnis in
cr_loan_clean.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print the number of nulls
print(____[____].____().____())
# Store the array on indices
____ = ____[____[____].____].____
# Save the new data without missing data
____ = ____.____(____)