Visualización de tablas
Una vez que hayas creado un SparkSession
, ¡puedes empezar a husmear para ver qué datos hay en tu clúster!
Tu SparkSession
tiene un atributo llamado catalog
que enumera todos los datos del clúster. Este atributo dispone de varios métodos para extraer diferentes informaciones.
Uno de los más útiles es el método .listTables()
, que devuelve los nombres de todas las tablas de tu clúster en forma de lista.
Este ejercicio forma parte del curso
Introducción a PySpark
Instrucciones del ejercicio
- Comprueba qué tablas hay en tu clúster llamando a
spark.catalog.listTables()
¡e imprimiendo el resultado!
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Print the tables in the catalog
print(spark.____.____())