Latihan membaca rencana kueri 2
Tiga dataframe tersedia: part2_df, part3_df, dan part4_df. Pertanyaan pada latihan ini dapat dijawab dengan memeriksa keluaran explain() dari masing-masing dataframe.
Perhatikan bahwa Spark menandai setiap nama kolom dengan deskriptor yang dipisahkan oleh simbol #. Misalnya, word#0, id#1L, part#2, dan title#3. Untuk keperluan latihan ini, deskriptor tersebut dapat diabaikan.
Latihan ini adalah bagian dari kursus
Pengantar Spark SQL dalam Python
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga