Een DataFrame uit de cache verwijderen
Je bent klaar met de analysetaken met de DataFrame departures_df, maar je moet nog andere verwerking doen. Je wilt de DataFrame uit de cache verwijderen om onnodig geheugengebruik op je cluster te voorkomen.
De DataFrame departures_df is gedefinieerd en is al voor je gecachet.
Deze oefening maakt deel uit van de cursus
Data opschonen met PySpark
Oefeninstructies
- Controleer de cache-status van de DataFrame
departures_df. - Verwijder de DataFrame
departures_dfuit de cache. - Controleer de cache-status opnieuw.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")
# Remove departures_df from the cache
____
# Check the cache status again
print("Is departures_df cached?: %s" % ____)