CommencerCommencer gratuitement

Utiliser la transformation de recommandation

Dans les derniers exercices, vous avez calculé la note moyenne par cours et nettoyé certaines données de cours. Vous allez utiliser ces données pour produire des recommandations pertinentes pour les étudiants de DataCamp.

Pour rappel, voici les règles de décision pour produire des recommandations :

  • Utiliser la technologie qu’un étudiant a le plus notée.
  • Exclure les cours qu’un étudiant a déjà notés.
  • Trouver les trois cours les mieux notés parmi les cours éligibles.

Pour produire les recommandations finales, vous utiliserez les notes moyennes des cours et la liste des recommandations éligibles par utilisateur, stockées respectivement dans avg_course_ratings et courses_to_recommend. Vous le ferez en complétant la fonction transform_recommendations() qui fusionne les deux DataFrames et identifie les 3 cours les mieux notés à recommander par utilisateur.

Cet exercice fait partie du cours

Introduction au data engineering

Afficher le cours

Instructions

  • Complétez la fonction transform_recommendations() :
  • Fusionnez course_to_recommend avec avg_course_ratings.
  • Triez les résultats par rating, en regroupant par identifiant utilisateur.
  • Affichez les 3 premières lignes et triez par identifiant utilisateur.
  • Appelez la fonction transform_recommendations() que vous venez de définir avec les arguments appropriés pour stocker les recommandations par utilisateur dans la variable recommendations.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Complete the transformation function
def transform_recommendations(avg_course_ratings, courses_to_recommend):
    # Merge both DataFrames
    merged = courses_to_recommend.____(____) 
    # Sort values by rating and group by user_id
    grouped = merged.sort_values("____", ascending=False).groupby("____")
    # Produce the top 3 values and sort by user_id
    recommendations = grouped.head(____).sort_values("____").reset_index()
    final_recommendations = recommendations[["user_id", "course_id","rating"]]
    # Return final recommendations
    return final_recommendations

# Use the function with the predefined DataFrame objects
recommendations = ____(____, ____)
Modifier et exécuter le code