Fehlende Daten mit fill und drop behandeln
Oh je … In diesem Datensatz gibt es viele fehlende Werte! Räumen wir das auf! Entferne in der geladenen CSV-Datei alle Zeilen mit beliebigen Nullwerten und zeige das Ergebnis an!
Denk daran: In deinem Workspace gibt es bereits eine SparkSession namens spark!
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Entferne alle Zeilen mit Nullwerten im DataFrame
census_df. - Zeige das resultierende DataFrame an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Drop rows with any nulls
census_cleaned = census_df.____
# Show the result
census_cleaned.____