MulaiMulai sekarang secara gratis

Memeriksa cache di Spark UI

Sebuah dataframe partitioned_df tersedia. Dataframe ini digunakan untuk mendaftarkan tabel sementara bernama text. Tabel text kemudian di-cache menggunakan spark.catalog.cacheTable('text'). Jika Anda menjalankan Spark secara lokal, Spark UI tersedia di http://localhost:4040/storage/. Untuk keperluan latihan ini, perhatikan gambar berikut. Gambar ini menunjukkan tampilan Spark UI setelah cache untuk text dimuat:

Spark UI Storage

Gambar ini menunjukkan bahwa sebuah tabel bernama text dengan tujuh partisi di-cache di memori. Manakah dari berikut ini yang akan langsung menyebabkan tampilan di atas muncul di Spark UI?

  1. Melakukan transformasi pada dataframe dasar, misalnya df = partitioned_df.distinct().

  2. Melakukan penghitungan pada dataframe dasar, misalnya: partitioned_df.count()

  3. Menjalankan kueri pada tabel, misalnya: spark.sql("select count(*) from text")

  4. Menjalankan kueri dan menampilkan hasilnya, misalnya: spark.sql("select count(*) from text").show()

Latihan ini adalah bagian dari kursus

Pengantar Spark SQL dalam Python

Lihat Kursus

Latihan interaktif praktis

Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.

Mulai berolahraga