1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySparkで学ぶBig Data入門

Connected

演習

PySpark の DataFrame を調べる

可視化、モデリング、学習などの分析を行う前に、データを確認することはとても重要です。このシンプルな演習では、前の演習で作成した people_df DataFrame を、基本的な DataFrame 演算子を使って確認します。

作業スペースにはすでに SparkSession spark と DataFrame people_df が用意されています。

指示

100 XP
  • people_df DataFrame の先頭 10 件の観測値を表示します。
  • people_df DataFrame の行数を数えます。
  • people_df DataFrame には何列あり、列名は何ですか?