Note moyenne par cours
Une excellente façon de recommander des cours est de recommander les cours les mieux notés, car les étudiants de DataCamp aiment souvent les cours qui sont bien notés par leurs pairs.
Dans cet exercice, vous compléterez une fonction de transformation transform_avg_rating()
qui agrège les données de notation à l'aide de la méthode .groupby()
du DataFrame pandas
. L'objectif est d'obtenir un DataFrame avec deux colonnes, un identifiant de cours et son évaluation moyenne :
course_id | avg_rating |
---|---|
123 | 4.72 |
111 | 4.62 |
Dans cet exercice, vous compléterez cette fonction de transformation et l'appliquerez aux données brutes d'évaluation extraites via la fonction d'aide extract_rating_data()
qui extrait les évaluations des cours du tableau rating
.
Cet exercice fait partie du cours
Introduction à l'ingénierie des données
Instructions
- Complétez la fonction
transform_avg_rating()
en groupant par la colonnecourse_id
et en prenant la moyenne de la colonnerating
. - Utilisez
extract_rating_data()
pour extraire les données brutes des classements. Il prend comme argument le moteur de base de donnéesdb_engines
. - Utilisez
transform_avg_rating()
pour les données brutes que vous avez extraites.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Complete the transformation function
def transform_avg_rating(rating_data):
# Group by course_id and extract average rating per course
avg_rating = rating_data.____('____').rating.____()
# Return sorted average ratings per course
sort_rating = avg_rating.sort_values(ascending=False).reset_index()
return sort_rating
# Extract the rating data into a DataFrame
rating_data = extract_rating_data(____)
# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data)