IniziaInizia gratis

Load in the data

Reading in data is the first step to using PySpark for data science! Let's leverage the new industry standard of parquet files!

Questo esercizio fa parte del corso

Feature Engineering with PySpark

Visualizza il corso

Istruzioni dell'esercizio

  • Use the parquet() file reader to read in 'Real_Estate.parq' as described in the video exercise.
  • Print out the list of columns with columns.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Read the file into a dataframe
df = spark.read.____(____)
# Print columns in dataframe
____(df.____)
Modifica ed esegui il codice