Muat data
Membaca data adalah langkah pertama untuk menggunakan PySpark dalam data science! Mari manfaatkan standar industri terbaru, yaitu file parquet!
Latihan ini adalah bagian dari kursus
Rekayasa Fitur dengan PySpark
Petunjuk latihan
- Gunakan pembaca file
parquet()untuk membaca'Real_Estate.parq'seperti dijelaskan dalam latihan video. - Cetak daftar kolom dengan
columns.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Read the file into a dataframe
df = spark.read.____(____)
# Print columns in dataframe
____(df.____)