Kurs başına ortalama puan
Kurs önermek için harika bir yol, en yüksek puanlı kursları önermektir; çünkü DataCamp öğrencileri, akranlarının yüksek puan verdiği kursları genellikle sever.
Bu egzersizde, pandas DataFrame'inin .groupby() metodunu kullanarak puan verilerini toplayan transform_avg_rating() dönüştürme fonksiyonunu tamamlayacaksın. Hedef, iki sütunlu bir DataFrame elde etmek: kurs kimliği ve ortalama puanı:
| course_id | avg_rating |
|---|---|
| 123 | 4.72 |
| 111 | 4.62 |
| … | … |
Bu egzersizde bu dönüştürme fonksiyonunu tamamlayacak ve rating tablosundan kurs puanlarını çıkaran yardımcı fonksiyon extract_rating_data() aracılığıyla alınan ham puan verilerine uygulayacaksın.
Bu egzersiz
Data Engineering'e Giriş
kursunun bir parçasıdırEgzersiz talimatları
transform_avg_rating()fonksiyonunu,course_idsütununa göre gruplayıpratingsütununun ortalamasını alarak tamamla.- Ham puan verilerini çıkarmak için
extract_rating_data()fonksiyonunu kullan. Argüman olarak veritabanı motorudb_enginesalır. - Çıkardığın ham puan verileri üzerinde
transform_avg_rating()fonksiyonunu uygula.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Complete the transformation function
def transform_avg_rating(rating_data):
# Group by course_id and extract average rating per course
avg_rating = rating_data.____('____').rating.____()
# Return sorted average ratings per course
sort_rating = avg_rating.sort_values(ascending=False).reset_index()
return sort_rating
# Extract the rating data into a DataFrame
rating_data = extract_rating_data(____)
# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data)