Scheda Storage della Spark UI
Una cartella sherlock_parts esiste su disco e contiene dodici file di testo.
ls sherlock_parts
sherlock_part0.txt sherlock_part2.txt sherlock_part7.txt
sherlock_part1.txt sherlock_part3.txt sherlock_part8.txt
sherlock_part10.txt sherlock_part4.txt sherlock_part9.txt
sherlock_part11.txt sherlock_part5.txt
sherlock_part12.txt sherlock_part6.txt
Quando viene caricata, crea un dataframe con sette partizioni.
partitioned_df = spark.read.text('sherlock_parts')
partitioned_df.rdd.getNumPartitions()
7
Viene creata una tabella e la tabella viene messa in cache:
partitioned_df.createOrReplaceTempView('text')
spark.catalog.cacheTable('text')

Domanda: Cosa apparirà nella scheda Storage della Spark UI una volta che l'operazione di cache verrà attivata da un'azione?
Questo esercizio fa parte del corso
Introduzione a Spark SQL in Python
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio