MulaiMulai sekarang secara gratis

Memuat dataframe dari berkas parquet

Sebuah berkas dataframe bernama sherlock_sentences.parquet tersedia di ruang kerja Anda. Setiap baris dataframe ini memuat satu klausa. Setiap klausa adalah rangkaian kata yang dipisahkan dari klausa lain oleh tanda baca, seperti titik, tanda kutip, dan pembatas bahasa alami lainnya yang menandai sebuah kalimat atau potongan kalimat. Misi Anda, jika Anda bersedia menerimanya, adalah memuat berkas ini.

Latihan ini adalah bagian dari kursus

Pengantar Spark SQL dalam Python

Lihat Kursus

Petunjuk latihan

  • Muat sherlock_sentences.parquet.
  • Saring dengan "id > 70", lalu tampilkan 5 baris pertama.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load the dataframe
df = ____('sherlock_sentences.parquet')

# Filter and show the first 5 rows
df.where('id > 70').____(____, truncate=False)
Edit dan Jalankan Kode