ComenzarEmpieza gratis

Visualización de tablas

Una vez que hayas creado un SparkSession, ¡puedes empezar a husmear para ver qué datos hay en tu clúster!

Tu SparkSession tiene un atributo llamado catalog que enumera todos los datos del clúster. Este atributo dispone de varios métodos para extraer diferentes informaciones.

Uno de los más útiles es el método .listTables(), que devuelve los nombres de todas las tablas de tu clúster en forma de lista.

Este ejercicio forma parte del curso

Introducción a PySpark

Ver curso

Instrucciones del ejercicio

  • Comprueba qué tablas hay en tu clúster llamando a spark.catalog.listTables() ¡e imprimiendo el resultado!

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Print the tables in the catalog
print(spark.____.____())
Editar y ejecutar código