Gemiddelde beoordeling per cursus
Een goede manier om cursussen aan te bevelen is om topcursussen aan te raden, omdat DataCamp-studenten vaak graag cursussen volgen die door medestudenten hoog zijn beoordeeld.
In deze oefening voltooi je een transformatiefunctie transform_avg_rating() die de beoordelingsgegevens aggregeert met de .groupby()-methode van een pandas DataFrame. Het doel is om een DataFrame te krijgen met twee kolommen: een course id en de gemiddelde beoordeling:
| course_id | avg_rating |
|---|---|
| 123 | 4.72 |
| 111 | 4.62 |
| … | … |
In deze oefening maak je deze transformatiefunctie af en pas je die toe op ruwe beoordelingsgegevens die zijn opgehaald via de helperfunctie extract_rating_data(), die cursusbeoordelingen ophaalt uit de tabel rating.
Deze oefening maakt deel uit van de cursus
Introductie tot Data Engineering
Oefeninstructies
- Maak de functie
transform_avg_rating()af door te groeperen op de kolomcourse_iden het gemiddelde te nemen van de kolomrating. - Gebruik
extract_rating_data()om ruwe beoordelingsgegevens op te halen. Deze neemt de database-enginedb_enginesals argument. - Gebruik
transform_avg_rating()op de ruwe beoordelingsgegevens die je hebt opgehaald.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Complete the transformation function
def transform_avg_rating(rating_data):
# Group by course_id and extract average rating per course
avg_rating = rating_data.____('____').rating.____()
# Return sorted average ratings per course
sort_rating = avg_rating.sort_values(ascending=False).reset_index()
return sort_rating
# Extract the rating data into a DataFrame
rating_data = extract_rating_data(____)
# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data)