Durchschnittliche Bewertung pro Kurs
Eine gute Möglichkeit, Kurse zu empfehlen, ist, die am besten bewerteten Kurse vorzuschlagen, weil DataCamp-Lernende oft Kurse mögen, die von anderen gut bewertet wurden.
In dieser Übung wendest du eine Transformationsfunktion namens transform_avg_rating()
an, die die Bewertungsdaten mit der Methode .groupby()
des DataFrame pandas
zusammenfasst. Das Ziel ist, einen DataFrame mit zwei Spalten zu erhalten, einer Kurs-ID und der durchschnittlichen Bewertung:
course_id | avg_rating |
---|---|
123 | 4,72 |
111 | 4,62 |
… | … |
In dieser Übung wirst du diese Transformationsfunktion fertigstellen und sie auf die Rohdaten der Bewertungen anwenden, die mit der Hilfsfunktion extract_rating_data()
extrahiert wurden, die Kursbewertungen aus der Tabelle rating
extrahiert.
Diese Übung ist Teil des Kurses
Einführung in das Data Engineering
Anleitung zur Übung
- Vervollständige die Funktion
transform_avg_rating()
, indem du nach der Spaltecourse_id
gruppierst und den Mittelwert der Spalterating
nimmst. - Verwende
extract_rating_data()
, um die Rohdaten der Bewertungen zu extrahieren. Es nimmt als Argument die Datenbank-Enginedb_engines
auf. - Wende
transform_avg_rating()
auf die von dir extrahierten Rohbewertungsdaten an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Complete the transformation function
def transform_avg_rating(rating_data):
# Group by course_id and extract average rating per course
avg_rating = rating_data.____('____').rating.____()
# Return sorted average ratings per course
sort_rating = avg_rating.sort_values(ascending=False).reset_index()
return sort_rating
# Extract the rating data into a DataFrame
rating_data = extract_rating_data(____)
# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data)