Memuat dataframe dari berkas parquet
Sebuah berkas dataframe bernama sherlock_sentences.parquet tersedia di ruang kerja Anda. Setiap baris dataframe ini memuat satu klausa. Setiap klausa adalah rangkaian kata yang dipisahkan dari klausa lain oleh tanda baca, seperti titik, tanda kutip, dan pembatas bahasa alami lainnya yang menandai sebuah kalimat atau potongan kalimat. Misi Anda, jika Anda bersedia menerimanya, adalah memuat berkas ini.
Latihan ini adalah bagian dari kursus
Pengantar Spark SQL dalam Python
Petunjuk latihan
- Muat
sherlock_sentences.parquet. - Saring dengan "id > 70", lalu tampilkan 5 baris pertama.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the dataframe
df = ____('sherlock_sentences.parquet')
# Filter and show the first 5 rows
df.where('id > 70').____(____, truncate=False)