DataFrame aus dem Zwischenspeicher entfernen
Du hast die Analyseaufgaben mit dem DataFrame departures_df abgeschlossen, musst aber noch einige andere Aufgaben erledigen. Du möchtest den DataFrame aus dem Cache entfernen, um eine übermäßige Speichernutzung in deinem Cluster zu verhindern.
Der DataFrame departures_df
ist definiert und wurde bereits für dich zwischengespeichert.
Diese Übung ist Teil des Kurses
Daten bereinigen mit PySpark
Anleitung zur Übung
- Überprüfe den Caching-Status des DataFrame
departures_df
. - Entferne den DataFrame
departures_df
aus dem Zwischenspeicher. - Überprüfe den Caching-Status erneut.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")
# Remove departures_df from the cache
____
# Check the cache status again
print("Is departures_df cached?: %s" % ____)