Mulai sekarangMulai gratis

Memuat dataframe dari berkas parquet

Sebuah berkas dataframe bernama sherlock_sentences.parquet tersedia di ruang kerja Anda. Setiap baris dataframe ini memuat satu klausa. Setiap klausa adalah rangkaian kata yang dipisahkan dari klausa lain oleh tanda baca, seperti titik, tanda kutip, dan pembatas bahasa alami lainnya yang menandai sebuah kalimat atau potongan kalimat. Misi Anda, jika Anda bersedia menerimanya, adalah memuat berkas ini.

Latihan ini merupakan bagian dari kursus

Pengantar Spark SQL dalam Python

Lihat Kursus

Instruksi latihan

  • Muat sherlock_sentences.parquet.
  • Saring dengan "id > 70", lalu tampilkan 5 baris pertama.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Load the dataframe
df = ____('sherlock_sentences.parquet')

# Filter and show the first 5 rows
df.where('id > 70').____(____, truncate=False)
Edit dan Jalankan Kode