IniziaInizia gratis

Scheda Storage della Spark UI

Una cartella sherlock_parts esiste su disco e contiene dodici file di testo.

ls sherlock_parts
sherlock_part0.txt   sherlock_part2.txt   sherlock_part7.txt
sherlock_part1.txt   sherlock_part3.txt   sherlock_part8.txt
sherlock_part10.txt  sherlock_part4.txt   sherlock_part9.txt
sherlock_part11.txt  sherlock_part5.txt
sherlock_part12.txt  sherlock_part6.txt

Quando viene caricata, crea un dataframe con sette partizioni.

partitioned_df = spark.read.text('sherlock_parts')
partitioned_df.rdd.getNumPartitions()
7

Viene creata una tabella e la tabella viene messa in cache:

partitioned_df.createOrReplaceTempView('text')
spark.catalog.cacheTable('text')

Spark UI Storage

Domanda: Cosa apparirà nella scheda Storage della Spark UI una volta che l'operazione di cache verrà attivata da un'azione?

Questo esercizio fa parte del corso

Introduzione a Spark SQL in Python

Visualizza il corso

Esercizio pratico interattivo

Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi

Inizia esercizio