Durchschnittliche Bewertung pro Kurs
Eine gute Möglichkeit, Kurse zu empfehlen, ist die Empfehlung von Kursen mit Top-Bewertungen, denn DataCamp-Teilnehmer/innen mögen oft Kurse, die von ihren Mitschüler/innen hoch bewertet werden.
In dieser Übung erstellst du eine Transformationsfunktion transform_avg_rating()
, die die Bewertungsdaten mithilfe der Methode .groupby()
des pandas
DataFrame aggregiert. Das Ziel ist es, einen DataFrame mit zwei Spalten zu erhalten: eine Kurs-ID und die durchschnittliche Bewertung:
course_id | avg_rating |
---|---|
123 | 4.72 |
111 | 4.62 |
… | … |
In dieser Übung vervollständigst du diese Transformationsfunktion und wendest sie auf Rohdaten an, die du mit der Hilfsfunktion extract_rating_data()
aus der Tabelle rating
extrahierst.
Diese Übung ist Teil des Kurses
Einführung in die Datentechnik
Anleitung zur Übung
- Vervollständige die Funktion
transform_avg_rating()
, indem du nach der Spaltecourse_id
gruppierst und den Mittelwert der Spalterating
bildest. - Verwende
extract_rating_data()
, um die Rohdaten der Bewertungen zu extrahieren. Sie nimmt als Argument die Datenbank-Enginedb_engines
an. - Verwende
transform_avg_rating()
für die rohen Bewertungsdaten, die du extrahiert hast.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Complete the transformation function
def transform_avg_rating(rating_data):
# Group by course_id and extract average rating per course
avg_rating = rating_data.____('____').rating.____()
# Return sorted average ratings per course
sort_rating = avg_rating.sort_values(ascending=False).reset_index()
return sort_rating
# Extract the rating data into a DataFrame
rating_data = extract_rating_data(____)
# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data)