LoslegenKostenlos loslegen

Durchschnittliche Bewertung pro Kurs

Eine gute Möglichkeit, Kurse zu empfehlen, ist die Empfehlung von Kursen mit Top-Bewertungen, denn DataCamp-Teilnehmer/innen mögen oft Kurse, die von ihren Mitschüler/innen hoch bewertet werden.

In dieser Übung erstellst du eine Transformationsfunktion transform_avg_rating(), die die Bewertungsdaten mithilfe der Methode .groupby() des pandas DataFrame aggregiert. Das Ziel ist es, einen DataFrame mit zwei Spalten zu erhalten: eine Kurs-ID und die durchschnittliche Bewertung:

course_id avg_rating
123 4.72
111 4.62

In dieser Übung vervollständigst du diese Transformationsfunktion und wendest sie auf Rohdaten an, die du mit der Hilfsfunktion extract_rating_data() aus der Tabelle rating extrahierst.

Diese Übung ist Teil des Kurses

Einführung in die Datentechnik

Kurs anzeigen

Anleitung zur Übung

  • Vervollständige die Funktion transform_avg_rating(), indem du nach der Spalte course_id gruppierst und den Mittelwert der Spalte rating bildest.
  • Verwende extract_rating_data(), um die Rohdaten der Bewertungen zu extrahieren. Sie nimmt als Argument die Datenbank-Engine db_engines an.
  • Verwende transform_avg_rating() für die rohen Bewertungsdaten, die du extrahiert hast.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Complete the transformation function
def transform_avg_rating(rating_data):
    # Group by course_id and extract average rating per course
    avg_rating = rating_data.____('____').rating.____()
    # Return sorted average ratings per course
    sort_rating = avg_rating.sort_values(ascending=False).reset_index()
    return sort_rating

# Extract the rating data into a DataFrame    
rating_data = extract_rating_data(____)

# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data) 
Code bearbeiten und ausführen