Fehlende Daten mit fill und drop behandeln
Oh je … In diesem Datensatz gibt es viele fehlende Werte! Lass uns aufräumen! Entferne mit der geladenen CSV-Datei alle Zeilen, die Nullwerte enthalten, und zeige das Ergebnis an!
Denk daran: In deinem Workspace gibt es bereits eine SparkSession namens spark!
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Entferne alle Zeilen mit Nullwerten im DataFrame
census_df. - Zeige den resultierenden DataFrame an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Drop rows with any nulls
census_cleaned = census_df.____
# Show the result
census_cleaned.____