Mettre en cache et retirer du cache des tables
Dans la leçon, nous avons vu que les tables peuvent être mises en cache. Alors qu’un dataframe est mis en cache avec une opération cache ou persist, une table l’est via l’opération cacheTable.
Une table appelée table1 est disponible.
Cet exercice fait partie du cours
Introduction à Spark SQL en Python
Instructions
- Listez les tables avec la méthode
listTables(). - Mettez
table1en cache et vérifiez qu’elle est bien en cache. - Retirez
table1du cache et vérifiez qu’elle n’est plus en cache.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# List the tables
print("Tables:\n", spark.____.____())
# Cache table1 and Confirm that it is cached
spark.catalog.____('table1')
print("table1 is cached: ", spark.catalog.____('table1'))
# Uncache table1 and confirm that it is uncached
spark.catalog.____('table1')
print("table1 is cached: ", spark.catalog.____('table1'))