1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySpark入門

Connected

演習

推論してフィルターする

ヘッダーとスキーマがあることが分かっている国勢調査のデータセットがあるとします。では、そのデータセットを読み込み、PySpark にスキーマを推論させましょう。40歳を超える成人でフィルターすると、どのような結果が得られますか?

作業環境には、すでに SparkSession の spark が用意されています!

指示

100 XP
  • JSON ファイル adults.json を読み込みます。
  • age が 40 を超える成人のみを含むようにデータをフィルターします。
  • 結果を表示します。