Retirer un DataFrame du cache
Vous avez terminé les analyses avec le DataFrame departures_df, mais d’autres traitements restent à faire. Vous souhaitez retirer ce DataFrame du cache pour éviter une utilisation excessive de mémoire sur votre cluster.
Le DataFrame departures_df est défini et a déjà été mis en cache pour vous.
Cet exercice fait partie du cours
Nettoyer des données avec PySpark
Instructions
- Vérifiez l’état de mise en cache du DataFrame
departures_df. - Retirez le DataFrame
departures_dfdu cache. - Contrôlez à nouveau l’état de mise en cache.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")
# Remove departures_df from the cache
____
# Check the cache status again
print("Is departures_df cached?: %s" % ____)