CommencerCommencer gratuitement

Retirer un DataFrame du cache

Vous avez terminé les analyses avec le DataFrame departures_df, mais d’autres traitements restent à faire. Vous souhaitez retirer ce DataFrame du cache pour éviter une utilisation excessive de mémoire sur votre cluster.

Le DataFrame departures_df est défini et a déjà été mis en cache pour vous.

Cet exercice fait partie du cours

Nettoyer des données avec PySpark

Afficher le cours

Instructions

  • Vérifiez l’état de mise en cache du DataFrame departures_df.
  • Retirez le DataFrame departures_df du cache.
  • Contrôlez à nouveau l’état de mise en cache.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")

# Remove departures_df from the cache
____

# Check the cache status again
print("Is departures_df cached?: %s" % ____)
Modifier et exécuter le code