1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySparkで学ぶ特徴量エンジニアリング

Connected

演習

データを読み込む

データを読み込むことは、PySpark でデータサイエンスを行う最初の一歩です。業界標準となった Parquet ファイルを活用してみましょう!

指示

100 XP
  • 動画の演習で紹介したとおり、parquet() リーダーを使って 'Real_Estate.parq' を読み込みます。
  • columns を使って列名のリストを出力します。