Aan de slagGa gratis aan de slag

Een DataFrame uit de cache verwijderen

Je bent klaar met de analysetaken met de DataFrame departures_df, maar je moet nog andere verwerking doen. Je wilt de DataFrame uit de cache verwijderen om onnodig geheugengebruik op je cluster te voorkomen.

De DataFrame departures_df is gedefinieerd en is al voor je gecachet.

Deze oefening maakt deel uit van de cursus

Data opschonen met PySpark

Cursus bekijken

Oefeninstructies

  • Controleer de cache-status van de DataFrame departures_df.
  • Verwijder de DataFrame departures_df uit de cache.
  • Controleer de cache-status opnieuw.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")

# Remove departures_df from the cache
____

# Check the cache status again
print("Is departures_df cached?: %s" % ____)
Code bewerken en uitvoeren