Memeriksa cache di Spark UI
Sebuah dataframe partitioned_df tersedia. Dataframe ini digunakan untuk mendaftarkan tabel sementara bernama text. Tabel text kemudian di-cache menggunakan spark.catalog.cacheTable('text'). Jika Anda menjalankan Spark secara lokal, Spark UI tersedia di http://localhost:4040/storage/. Untuk keperluan latihan ini, perhatikan gambar berikut. Gambar ini menunjukkan tampilan Spark UI setelah cache untuk text dimuat:

Gambar ini menunjukkan bahwa sebuah tabel bernama text dengan tujuh partisi di-cache di memori. Manakah dari berikut ini yang akan langsung menyebabkan tampilan di atas muncul di Spark UI?
Melakukan transformasi pada dataframe dasar, misalnya
df = partitioned_df.distinct().Melakukan penghitungan pada dataframe dasar, misalnya:
partitioned_df.count()Menjalankan kueri pada tabel, misalnya:
spark.sql("select count(*) from text")Menjalankan kueri dan menampilkan hasilnya, misalnya:
spark.sql("select count(*) from text").show()
Latihan ini adalah bagian dari kursus
Pengantar Spark SQL dalam Python
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga