CommencerCommencer gratuitement

Suppression d'un DataFrame de la mémoire cache

Vous avez terminé les tâches d'analyse du DataFrame departures_df, mais il vous reste d'autres traitements à effectuer. Vous souhaitez supprimer le DataFrame du cache afin d'éviter toute utilisation excessive de la mémoire sur votre cluster.

Le DataFrame departures_df est défini et a déjà été mis en cache pour vous.

Cet exercice fait partie du cours

Nettoyer des données avec PySpark

Afficher le cours

Instructions

  • Vérifiez l'état de la mise en cache du DataFrame departures_df.
  • Retirez le DataFrame departures_df de la mémoire cache.
  • Validez à nouveau l'état de la mise en cache.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")

# Remove departures_df from the cache
____

# Check the cache status again
print("Is departures_df cached?: %s" % ____)
Modifier et exécuter le code