1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySparkで学ぶBig Data入門

Connected

演習

PySpark DataFrameの可視化

データを理解し解釈するには、グラフによる表現、つまり可視化がとても重要です。このシンプルな可視化の演習では、まず以前に作成したnames_df DataFrameの列名を表示し、次にnames_dfをPandasのDataFrameに変換し、最後に人の名前をx軸、年齢をy軸とした横向きの棒グラフとして内容をプロットします。

作業スペースにはすでにSparkSession spark とDataFrame names_df が用意されていることを忘れないでください。

指示

100 XP
  • names_df DataFrameの列名を表示します。
  • names_df DataFrameをPandasのDataFrame df_pandas に変換します。
  • matplotlibのplot()メソッドを使って、x軸に'Name'、y軸に'Age'を配置した横向きの棒グラフを作成します。