Removendo um DataFrame do cache
Você terminou as tarefas de análise com o DataFrame departures_df, mas tem outros processamentos a fazer. Você gostaria de remover o DataFrame do cache para evitar o uso excessivo de memória em seu cluster.
O DataFrame departures_df
está definido e já foi armazenado em cache para você.
Este exercício faz parte do curso
Limpeza de dados com o PySpark
Instruções do exercício
- Verifique o status do cache no DataFrame
departures_df
. - Remova o DataFrame
departures_df
do cache. - Valide o status do cache novamente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")
# Remove departures_df from the cache
____
# Check the cache status again
print("Is departures_df cached?: %s" % ____)