LoslegenKostenlos starten

Load in the data

Reading in data is the first step to using PySpark for data science! Let's leverage the new industry standard of parquet files!

Diese Übung ist Teil des Kurses

<Kurs>Feature Engineering with PySpark</Kurs>
Kurs ansehen

Übungsanweisungen

  • Use the parquet() file reader to read in 'Real_Estate.parq' as described in the video exercise.
  • Print out the list of columns with columns.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Read the file into a dataframe
df = spark.read.____(____)
# Print columns in dataframe
____(df.____)
Code bearbeiten und ausführen