Visualizzare le tabelle
Dopo aver creato una SparkSession, puoi iniziare a curiosare per vedere quali dati ci sono nel tuo cluster!
La tua SparkSession ha un attributo chiamato catalog che elenca tutti i dati all'interno del cluster. Questo attributo offre alcuni metodi per estrarre informazioni diverse.
Uno dei più utili è il metodo .listTables(), che restituisce l'elenco dei nomi di tutte le tabelle nel tuo cluster.
Questo esercizio fa parte del corso
Fondamenti di PySpark
Istruzioni dell'esercizio
- Scopri quali tabelle ci sono nel tuo cluster chiamando
spark.catalog.listTables()e stampando il risultato!
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print the tables in the catalog
print(spark.____.____())