Zeilen entfernen
Wenn du weißt, dass eine bestimmte Spalte für deine Analyse entscheidend ist und nur ein kleiner Teil der Zeilen in dieser Spalte keinen Wert hat, ist es oft sinnvoll, diese Zeilen aus dem Datensatz zu entfernen.
In diesem Kurs ist die Spalte driver_gender für viele deiner Analysen entscheidend. Da nur ein kleiner Teil der Zeilen driver_gender fehlt, entfernen wir diese Zeilen aus dem Datensatz.
Diese Übung ist Teil des Kurses
Analyse polizeilicher Maßnahmen mit pandas
Anleitung zur Übung
- Zähle die Anzahl der fehlenden Werte in jeder Spalte.
- Entferne alle Zeilen, denen
driver_genderfehlt, indem du den Spaltennamen an den Parametersubsetvon.dropna()übergibst. - Zähle die Anzahl der fehlenden Werte in jeder Spalte erneut, um zu prüfen, dass in den verbleibenden Zeilen
driver_gendernicht fehlt. - Untersuche die
.shapedes DataFrames, um zu sehen, wie viele Zeilen und Spalten übrig sind.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Count the number of missing values in each column
print(ri.isnull().____)
# Drop all rows that are missing 'driver_gender'
ri.____(subset=[____], inplace=True)
# Count the number of missing values in each column (again)
print(ri.____.____)
# Examine the shape of the DataFrame
print(____)