CommencerCommencer gratuitement

Note moyenne par cours

Une excellente façon de recommander des cours est de recommander les cours les mieux notés, car les étudiants de DataCamp aiment souvent les cours qui sont bien notés par leurs pairs.

Dans cet exercice, vous compléterez une fonction de transformation transform_avg_rating() qui agrège les données de notation à l'aide de la méthode .groupby() du DataFrame pandas. L'objectif est d'obtenir un DataFrame avec deux colonnes, un identifiant de cours et son évaluation moyenne :

course_id avg_rating
123 4.72
111 4.62

Dans cet exercice, vous compléterez cette fonction de transformation et l'appliquerez aux données brutes d'évaluation extraites via la fonction d'aide extract_rating_data() qui extrait les évaluations des cours du tableau rating.

Cet exercice fait partie du cours

Introduction à l'ingénierie des données

Afficher le cours

Instructions

  • Complétez la fonction transform_avg_rating() en groupant par la colonne course_id et en prenant la moyenne de la colonne rating.
  • Utilisez extract_rating_data() pour extraire les données brutes des classements. Il prend comme argument le moteur de base de données db_engines.
  • Utilisez transform_avg_rating() pour les données brutes que vous avez extraites.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Complete the transformation function
def transform_avg_rating(rating_data):
    # Group by course_id and extract average rating per course
    avg_rating = rating_data.____('____').rating.____()
    # Return sorted average ratings per course
    sort_rating = avg_rating.sort_values(ascending=False).reset_index()
    return sort_rating

# Extract the rating data into a DataFrame    
rating_data = extract_rating_data(____)

# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data) 
Modifier et exécuter le code