IniziaInizia gratis

Valutazione media per corso

Un ottimo modo per consigliare i corsi è proporre quelli con le valutazioni più alte: gli studenti di DataCamp tendono ad apprezzare i corsi molto ben valutati dai loro pari.

In questo esercizio completerai una funzione di trasformazione transform_avg_rating() che aggrega i dati delle valutazioni usando il metodo .groupby() dei DataFrame di pandas. L’obiettivo è ottenere un DataFrame con due colonne: l’id del corso e la sua valutazione media:

course_id avg_rating
123 4.72
111 4.62

In questo esercizio completerai questa funzione di trasformazione e la applicherai ai dati grezzi delle valutazioni estratti tramite la funzione di supporto extract_rating_data(), che estrae le valutazioni dei corsi dalla tabella rating.

Questo esercizio fa parte del corso

Introduzione al Data Engineering

Visualizza il corso

Istruzioni dell'esercizio

  • Completa la funzione transform_avg_rating() raggruppando per la colonna course_id e calcolando la media della colonna rating.
  • Usa extract_rating_data() per estrarre i dati grezzi delle valutazioni. Accetta come argomento il motore del database db_engines.
  • Usa transform_avg_rating() sui dati grezzi che hai estratto.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Complete the transformation function
def transform_avg_rating(rating_data):
    # Group by course_id and extract average rating per course
    avg_rating = rating_data.____('____').rating.____()
    # Return sorted average ratings per course
    sort_rating = avg_rating.sort_values(ascending=False).reset_index()
    return sort_rating

# Extract the rating data into a DataFrame    
rating_data = extract_rating_data(____)

# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data) 
Modifica ed esegui il codice