MulaiMulai sekarang secara gratis

Tab storage di Spark UI

Sebuah folder sherlock_parts ada di disk yang berisi dua belas berkas teks.

ls sherlock_parts
sherlock_part0.txt   sherlock_part2.txt   sherlock_part7.txt
sherlock_part1.txt   sherlock_part3.txt   sherlock_part8.txt
sherlock_part10.txt  sherlock_part4.txt   sherlock_part9.txt
sherlock_part11.txt  sherlock_part5.txt
sherlock_part12.txt  sherlock_part6.txt

Saat dimuat, ini membuat sebuah dataframe dengan tujuh partisi.

partitioned_df = spark.read.text('sherlock_parts')
partitioned_df.rdd.getNumPartitions()
7

Sebuah tabel dibuat, dan tabel tersebut di-cache:

partitioned_df.createOrReplaceTempView('text')
spark.catalog.cacheTable('text')

Spark UI Storage

Pertanyaan: Apa yang akan muncul di tab Storage pada Spark UI setelah operasi cache dipicu oleh sebuah action?

Latihan ini adalah bagian dari kursus

Pengantar Spark SQL dalam Python

Lihat Kursus

Latihan interaktif praktis

Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.

Mulai berolahraga