MulaiMulai sekarang secara gratis

Rata-rata penilaian per course

Cara yang efektif untuk merekomendasikan course adalah menyarankan course dengan penilaian tertinggi, karena mahasiswa DataCamp sering menyukai course yang mendapat nilai tinggi dari rekan-rekannya.

Dalam latihan ini, Anda akan melengkapi fungsi transformasi transform_avg_rating() yang mengagregasikan data penilaian menggunakan metode .groupby() milik DataFrame pandas. Tujuannya adalah memperoleh sebuah DataFrame dengan dua kolom, yaitu id course dan rata-rata penilaiannya:

course_id avg_rating
123 4.72
111 4.62

Pada latihan ini, Anda akan melengkapi fungsi transformasi tersebut, lalu menerapkannya pada data penilaian mentah yang diekstrak melalui fungsi pembantu extract_rating_data() yang mengekstrak penilaian course dari tabel rating.

Latihan ini adalah bagian dari kursus

Pengantar Data Engineering

Lihat Kursus

Petunjuk latihan

  • Lengkapi fungsi transform_avg_rating() dengan melakukan pengelompokan berdasarkan kolom course_id, lalu ambil rata-rata dari kolom rating.
  • Gunakan extract_rating_data() untuk mengekstrak data penilaian mentah. Fungsi ini menerima argumen mesin basis data db_engines.
  • Gunakan transform_avg_rating() pada data penilaian mentah yang telah Anda ekstrak.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Complete the transformation function
def transform_avg_rating(rating_data):
    # Group by course_id and extract average rating per course
    avg_rating = rating_data.____('____').rating.____()
    # Return sorted average ratings per course
    sort_rating = avg_rating.sort_values(ascending=False).reset_index()
    return sort_rating

# Extract the rating data into a DataFrame    
rating_data = extract_rating_data(____)

# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data) 
Edit dan Jalankan Kode