1. 学ぶ
  2. /
  3. コース
  4. /
  5. データエンジニアリング入門

Connected

演習

コースごとの平均評価

おすすめを作るうえで効果的なのは、高評価のコースを勧めることです。DataCamp の受講生は、仲間から高く評価されているコースを好む傾向があります。

この演習では、pandas の DataFrame にある .groupby() メソッドを使って評価データを集約する変換関数 transform_avg_rating() を完成させます。目的は、コース ID とその平均評価の2列を持つ DataFrame を得ることです。

course_id avg_rating
123 4.72
111 4.62
… …

この演習では、この変換関数を完成させ、ヘルパー関数 extract_rating_data() を使って取得した生の評価データに適用します。extract_rating_data() は rating テーブルからコースの評価を抽出します。

指示

100 XP
  • transform_avg_rating() 関数を完成させてください。course_id 列でグループ化し、rating 列の平均を計算します。
  • extract_rating_data() を使って生の評価データを抽出します。引数にはデータベースエンジン db_engines を渡します。
  • 抽出した生データに対して transform_avg_rating() を適用します。