Suppression d'un DataFrame de la mémoire cache
Vous avez terminé les tâches d'analyse du DataFrame departures_df, mais il vous reste d'autres traitements à effectuer. Vous souhaitez supprimer le DataFrame du cache afin d'éviter toute utilisation excessive de la mémoire sur votre cluster.
Le DataFrame departures_df
est défini et a déjà été mis en cache pour vous.
Cet exercice fait partie du cours
Nettoyer des données avec PySpark
Instructions
- Vérifiez l'état de la mise en cache du DataFrame
departures_df
. - Retirez le DataFrame
departures_df
de la mémoire cache. - Validez à nouveau l'état de la mise en cache.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")
# Remove departures_df from the cache
____
# Check the cache status again
print("Is departures_df cached?: %s" % ____)