Colocando e removendo tabelas do cache
Na aula, vimos que é possível colocar tabelas em cache. Enquanto um dataframe é colocado em cache usando uma operação cache ou persist, uma tabela é colocada em cache usando a operação cacheTable.
Uma tabela chamada table1 está disponível.
Este exercício faz parte do curso
Introdução ao Spark SQL em Python
Instruções do exercício
- Liste as tabelas com o método
listTables(). - Coloque
table1em cache e confirme que ela foi armazenada em cache. - Remova
table1do cache e confirme que ela foi removida do cache.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# List the tables
print("Tables:\n", spark.____.____())
# Cache table1 and Confirm that it is cached
spark.catalog.____('table1')
print("table1 is cached: ", spark.catalog.____('table1'))
# Uncache table1 and confirm that it is uncached
spark.catalog.____('table1')
print("table1 is cached: ", spark.catalog.____('table1'))