Ein DataFrame aus dem Cache entfernen
Du hast die Analyseaufgaben mit dem DataFrame departures_df abgeschlossen, musst aber noch weitere Verarbeitungsschritte durchführen. Du möchtest den DataFrame aus dem Cache entfernen, um unnötige Speichernutzung auf deinem Cluster zu vermeiden.
Der DataFrame departures_df ist definiert und wurde bereits für dich zwischengespeichert (gecached).
Diese Übung ist Teil des Kurses
Datenbereinigung mit PySpark
Anleitung zur Übung
- Prüfe den Cache-Status des DataFrames
departures_df. - Entferne den DataFrame
departures_dfaus dem Cache. - Überprüfe den Cache-Status erneut.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")
# Remove departures_df from the cache
____
# Check the cache status again
print("Is departures_df cached?: %s" % ____)