Aan de slagGa gratis aan de slag

Gemiddelde beoordeling per cursus

Een goede manier om cursussen aan te bevelen is om topcursussen aan te raden, omdat DataCamp-studenten vaak graag cursussen volgen die door medestudenten hoog zijn beoordeeld.

In deze oefening voltooi je een transformatiefunctie transform_avg_rating() die de beoordelingsgegevens aggregeert met de .groupby()-methode van een pandas DataFrame. Het doel is om een DataFrame te krijgen met twee kolommen: een course id en de gemiddelde beoordeling:

course_id avg_rating
123 4.72
111 4.62

In deze oefening maak je deze transformatiefunctie af en pas je die toe op ruwe beoordelingsgegevens die zijn opgehaald via de helperfunctie extract_rating_data(), die cursusbeoordelingen ophaalt uit de tabel rating.

Deze oefening maakt deel uit van de cursus

Introductie tot Data Engineering

Cursus bekijken

Oefeninstructies

  • Maak de functie transform_avg_rating() af door te groeperen op de kolom course_id en het gemiddelde te nemen van de kolom rating.
  • Gebruik extract_rating_data() om ruwe beoordelingsgegevens op te halen. Deze neemt de database-engine db_engines als argument.
  • Gebruik transform_avg_rating() op de ruwe beoordelingsgegevens die je hebt opgehaald.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Complete the transformation function
def transform_avg_rating(rating_data):
    # Group by course_id and extract average rating per course
    avg_rating = rating_data.____('____').rating.____()
    # Return sorted average ratings per course
    sort_rating = avg_rating.sort_values(ascending=False).reset_index()
    return sort_rating

# Extract the rating data into a DataFrame    
rating_data = extract_rating_data(____)

# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data) 
Code bewerken en uitvoeren