Rata-rata penilaian per course
Cara yang efektif untuk merekomendasikan course adalah menyarankan course dengan penilaian tertinggi, karena mahasiswa DataCamp sering menyukai course yang mendapat nilai tinggi dari rekan-rekannya.
Dalam latihan ini, Anda akan melengkapi fungsi transformasi transform_avg_rating() yang mengagregasikan data penilaian menggunakan metode .groupby() milik DataFrame pandas. Tujuannya adalah memperoleh sebuah DataFrame dengan dua kolom, yaitu id course dan rata-rata penilaiannya:
| course_id | avg_rating |
|---|---|
| 123 | 4.72 |
| 111 | 4.62 |
| … | … |
Pada latihan ini, Anda akan melengkapi fungsi transformasi tersebut, lalu menerapkannya pada data penilaian mentah yang diekstrak melalui fungsi pembantu extract_rating_data() yang mengekstrak penilaian course dari tabel rating.
Latihan ini adalah bagian dari kursus
Pengantar Data Engineering
Petunjuk latihan
- Lengkapi fungsi
transform_avg_rating()dengan melakukan pengelompokan berdasarkan kolomcourse_id, lalu ambil rata-rata dari kolomrating. - Gunakan
extract_rating_data()untuk mengekstrak data penilaian mentah. Fungsi ini menerima argumen mesin basis datadb_engines. - Gunakan
transform_avg_rating()pada data penilaian mentah yang telah Anda ekstrak.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Complete the transformation function
def transform_avg_rating(rating_data):
# Group by course_id and extract average rating per course
avg_rating = rating_data.____('____').rating.____()
# Return sorted average ratings per course
sort_rating = avg_rating.sort_values(ascending=False).reset_index()
return sort_rating
# Extract the rating data into a DataFrame
rating_data = extract_rating_data(____)
# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data)