Valutazione media per corso
Un ottimo modo per consigliare i corsi è proporre quelli con le valutazioni più alte: gli studenti di DataCamp tendono ad apprezzare i corsi molto ben valutati dai loro pari.
In questo esercizio completerai una funzione di trasformazione transform_avg_rating() che aggrega i dati delle valutazioni usando il metodo .groupby() dei DataFrame di pandas. L’obiettivo è ottenere un DataFrame con due colonne: l’id del corso e la sua valutazione media:
| course_id | avg_rating |
|---|---|
| 123 | 4.72 |
| 111 | 4.62 |
| … | … |
In questo esercizio completerai questa funzione di trasformazione e la applicherai ai dati grezzi delle valutazioni estratti tramite la funzione di supporto extract_rating_data(), che estrae le valutazioni dei corsi dalla tabella rating.
Questo esercizio fa parte del corso
Introduzione al Data Engineering
Istruzioni dell'esercizio
- Completa la funzione
transform_avg_rating()raggruppando per la colonnacourse_ide calcolando la media della colonnarating. - Usa
extract_rating_data()per estrarre i dati grezzi delle valutazioni. Accetta come argomento il motore del databasedb_engines. - Usa
transform_avg_rating()sui dati grezzi che hai estratto.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Complete the transformation function
def transform_avg_rating(rating_data):
# Group by course_id and extract average rating per course
avg_rating = rating_data.____('____').rating.____()
# Return sorted average ratings per course
sort_rating = avg_rating.sort_values(ascending=False).reset_index()
return sort_rating
# Extract the rating data into a DataFrame
rating_data = extract_rating_data(____)
# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data)