1. 学ぶ
  2. /
  3. コース
  4. /
  5. データエンジニアリング入門

Connected

演習

ratings との結合

ビデオ演習では、PySpark の変換を使って film テーブルと ratings テーブルを結合し、顧客ごとの平均評価を保存する新しい列を作成する方法を見ました。 この演習では、同じ手法を使って各作品の平均評価を計算し、film と ratings テーブルの連携をさらに強化します。

映画の PySpark DataFrame film_df と、評価の PySpark DataFrame rating_df がワークスペースに用意されています。

指示

100 XP
  • film_id ごとに平均評価を計算し、結果を ratings_per_film_df に代入します。
  • .join() の記述を完成させ、film_id 列で結合します。
  • 得られた DataFrame の最初の 5 件を表示します。