LoslegenKostenlos loslegen

Zeilen entfernen

Wenn du weißt, dass eine bestimmte Spalte für deine Analyse entscheidend ist und nur ein kleiner Teil der Zeilen in dieser Spalte keinen Wert hat, ist es oft sinnvoll, diese Zeilen aus dem Datensatz zu entfernen.

In diesem Kurs ist die Spalte driver_gender für viele deiner Analysen entscheidend. Da nur ein kleiner Teil der Zeilen driver_gender fehlt, entfernen wir diese Zeilen aus dem Datensatz.

Diese Übung ist Teil des Kurses

Analyse polizeilicher Maßnahmen mit pandas

Kurs anzeigen

Anleitung zur Übung

  • Zähle die Anzahl der fehlenden Werte in jeder Spalte.
  • Entferne alle Zeilen, denen driver_gender fehlt, indem du den Spaltennamen an den Parameter subset von .dropna() übergibst.
  • Zähle die Anzahl der fehlenden Werte in jeder Spalte erneut, um zu prüfen, dass in den verbleibenden Zeilen driver_gender nicht fehlt.
  • Untersuche die .shape des DataFrames, um zu sehen, wie viele Zeilen und Spalten übrig sind.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Count the number of missing values in each column
print(ri.isnull().____)

# Drop all rows that are missing 'driver_gender'
ri.____(subset=[____], inplace=True)

# Count the number of missing values in each column (again)
print(ri.____.____)

# Examine the shape of the DataFrame
print(____)
Code bearbeiten und ausführen