Muat data
Membaca data adalah langkah pertama untuk menggunakan PySpark dalam data science! Mari manfaatkan standar industri terbaru, yaitu file parquet!
Latihan ini merupakan bagian dari kursus
Rekayasa Fitur dengan PySpark
Instruksi latihan
- Gunakan pembaca file
parquet()untuk membaca'Real_Estate.parq'seperti dijelaskan dalam latihan video. - Cetak daftar kolom dengan
columns.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Read the file into a dataframe
df = spark.read.____(____)
# Print columns in dataframe
____(df.____)