LoslegenKostenlos loslegen

Durchschnittliche Bewertung pro Kurs

Eine gute Möglichkeit, Kurse zu empfehlen, ist, die am besten bewerteten Kurse vorzuschlagen, weil DataCamp-Lernende oft Kurse mögen, die von anderen gut bewertet wurden.

In dieser Übung wendest du eine Transformationsfunktion namens transform_avg_rating() an, die die Bewertungsdaten mit der Methode .groupby() des DataFrame pandas zusammenfasst. Das Ziel ist, einen DataFrame mit zwei Spalten zu erhalten, einer Kurs-ID und der durchschnittlichen Bewertung:

course_id avg_rating
123 4,72
111 4,62

In dieser Übung wirst du diese Transformationsfunktion fertigstellen und sie auf die Rohdaten der Bewertungen anwenden, die mit der Hilfsfunktion extract_rating_data() extrahiert wurden, die Kursbewertungen aus der Tabelle rating extrahiert.

Diese Übung ist Teil des Kurses

Einführung in das Data Engineering

Kurs anzeigen

Anleitung zur Übung

  • Vervollständige die Funktion transform_avg_rating(), indem du nach der Spalte course_id gruppierst und den Mittelwert der Spalte rating nimmst.
  • Verwende extract_rating_data(), um die Rohdaten der Bewertungen zu extrahieren. Es nimmt als Argument die Datenbank-Engine db_engines auf.
  • Wende transform_avg_rating() auf die von dir extrahierten Rohbewertungsdaten an.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Complete the transformation function
def transform_avg_rating(rating_data):
    # Group by course_id and extract average rating per course
    avg_rating = rating_data.____('____').rating.____()
    # Return sorted average ratings per course
    sort_rating = avg_rating.sort_values(ascending=False).reset_index()
    return sort_rating

# Extract the rating data into a DataFrame    
rating_data = extract_rating_data(____)

# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data) 
Code bearbeiten und ausführen