Ein DataFrame aus dem Cache entfernen
Du hast die Analyseaufgaben mit dem DataFrame departures_df abgeschlossen, musst aber noch weitere Verarbeitungsschritte durchführen. Du möchtest den DataFrame aus dem Cache entfernen, um unnötige Speichernutzung auf deinem Cluster zu vermeiden.
Der DataFrame departures_df ist definiert und wurde bereits für dich zwischengespeichert (gecached).
Diese Übung ist Teil des Kurses
<Kurs>Datenbereinigung mit PySpark</Kurs>Übungsanweisungen
- Prüfe den Cache-Status des DataFrames
departures_df. - Entferne den DataFrame
departures_dfaus dem Cache. - Überprüfe den Cache-Status erneut.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")
# Remove departures_df from the cache
____
# Check the cache status again
print("Is departures_df cached?: %s" % ____)