LoslegenKostenlos loslegen

Fehlende Daten entfernen

Du hast fehlende Daten in person_emp_length ersetzt, aber in der vorherigen Übung hast du gesehen, dass loan_int_rate ebenfalls fehlende Werte enthält.

Ähnlich wie bei fehlenden Daten in loan_status erschweren fehlende Daten in loan_int_rate die Vorhersagen.

Da die Zinssätze von deinem Unternehmen festgelegt werden, ist es sehr ungewöhnlich, dass in dieser Spalte Werte fehlen. Möglich, dass Probleme bei der Datenaufnahme zu Fehlern geführt haben, aber sicher weißt du es nicht. Für den Moment ist es am besten, diese Einträge mit .drop() zu entfernen, bevor du weitermachst.

Der Datensatz cr_loan wurde in den Workspace geladen.

Diese Übung ist Teil des Kurses

Kreditrisikomodellierung in Python

Kurs anzeigen

Anleitung zur Übung

  • Gib die Anzahl der Einträge aus, die fehlende Daten für den Zinssatz enthalten.
  • Erstelle ein Array mit den Indizes der Zeilen mit fehlendem Zinssatz und nenne es indices.
  • Entferne die Einträge mit fehlendem Zinssatz und speichere das Ergebnis in cr_loan_clean.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Print the number of nulls
print(____[____].____().____())

# Store the array on indices
____ = ____[____[____].____].____

# Save the new data without missing data
____ = ____.____(____)
Code bearbeiten und ausführen