ComenzarEmpieza gratis

Pestaña Storage de la Spark UI

Existe en disco una carpeta sherlock_parts que contiene doce archivos de texto.

ls sherlock_parts
sherlock_part0.txt   sherlock_part2.txt   sherlock_part7.txt
sherlock_part1.txt   sherlock_part3.txt   sherlock_part8.txt
sherlock_part10.txt  sherlock_part4.txt   sherlock_part9.txt
sherlock_part11.txt  sherlock_part5.txt
sherlock_part12.txt  sherlock_part6.txt

Al cargarla, se crea un dataframe con siete particiones.

partitioned_df = spark.read.text('sherlock_parts')
partitioned_df.rdd.getNumPartitions()
7

Se crea una tabla y se almacena en caché la tabla:

partitioned_df.createOrReplaceTempView('text')
spark.catalog.cacheTable('text')

Spark UI Storage

Pregunta: ¿Qué aparecerá en la pestaña Storage de la Spark UI cuando una acción dispare la operación de caché?

Este ejercicio forma parte del curso

Introducción a Spark SQL en Python

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio