1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySparkで学ぶBig Data入門

Connected

演習

CSV を DataFrame に読み込む

前の演習では、RDD から DataFrame を作成する方法を見ました。一般的には、CSV ファイルからデータを読み込むのが DataFrame を作成する最も一般的な方法です。この演習では、すでに file_path として与えられている people.csv ファイルから PySpark の DataFrame を作成し、作成したオブジェクトが PySpark の DataFrame であることを確認します。

ワークスペースにはすでに SparkSession の spark と、people.csv へのパスである変数 file_path が用意されています。

指示

100 XP
  • people.csv へのパスである変数 file_path から DataFrame を作成します。
  • 出力が PySpark の DataFrame であることを確認します。