LoslegenKostenlos starten

Zeilen entfernen

Wenn du weißt, dass eine bestimmte Spalte für deine Analyse entscheidend ist und nur ein kleiner Teil der Zeilen in dieser Spalte keinen Wert hat, ist es oft sinnvoll, diese Zeilen aus dem Datensatz zu entfernen.

In diesem Kurs ist die Spalte driver_gender für viele deiner Analysen entscheidend. Da nur ein kleiner Teil der Zeilen driver_gender fehlt, entfernen wir diese Zeilen aus dem Datensatz.

Diese Übung ist Teil des Kurses

<Kurs>Analyse polizeilicher Maßnahmen mit pandas</Kurs>
Kurs ansehen

Übungsanweisungen

  • Zähle die Anzahl der fehlenden Werte in jeder Spalte.
  • Entferne alle Zeilen, denen driver_gender fehlt, indem du den Spaltennamen an den Parameter subset von .dropna() übergibst.
  • Zähle die Anzahl der fehlenden Werte in jeder Spalte erneut, um zu prüfen, dass in den verbleibenden Zeilen driver_gender nicht fehlt.
  • Untersuche die .shape des DataFrames, um zu sehen, wie viele Zeilen und Spalten übrig sind.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Count the number of missing values in each column
print(ri.isnull().____)

# Drop all rows that are missing 'driver_gender'
ri.____(subset=[____], inplace=True)

# Count the number of missing values in each column (again)
print(ri.____.____)

# Examine the shape of the DataFrame
print(____)
Code bearbeiten und ausführen