ComeçarComece de graça

Removendo um DataFrame do cache

Você terminou as tarefas de análise com o DataFrame departures_df, mas tem outros processamentos a fazer. Você gostaria de remover o DataFrame do cache para evitar o uso excessivo de memória em seu cluster.

O DataFrame departures_df está definido e já foi armazenado em cache para você.

Este exercício faz parte do curso

Limpeza de dados com o PySpark

Ver curso

Instruções do exercício

  • Verifique o status do cache no DataFrame departures_df.
  • Remova o DataFrame departures_df do cache.
  • Valide o status do cache novamente.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")

# Remove departures_df from the cache
____

# Check the cache status again
print("Is departures_df cached?: %s" % ____)
Editar e executar o código