Mettere in cache e rimuovere dalla cache le tabelle
Nella lezione abbiamo visto che le tabelle possono essere messe in cache. Mentre un dataframe si mette in cache con un'operazione cache o persist, una tabella si mette in cache con un'operazione cacheTable.
È disponibile una tabella chiamata table1.
Questo esercizio fa parte del corso
Introduzione a Spark SQL in Python
Istruzioni dell'esercizio
- Elenca le tabelle con il metodo
listTables(). - Metti in cache
table1e conferma che sia in cache. - Rimuovi dalla cache
table1e conferma che non sia più in cache.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# List the tables
print("Tables:\n", spark.____.____())
# Cache table1 and Confirm that it is cached
spark.catalog.____('table1')
print("table1 is cached: ", spark.catalog.____('table1'))
# Uncache table1 and confirm that it is uncached
spark.catalog.____('table1')
print("table1 is cached: ", spark.catalog.____('table1'))