Valoración media por curso
Una forma estupenda de recomendar cursos es recomendar los mejor valorados, ya que a los alumnos de DataCamp suelen gustarles los cursos mejor valorados por sus compañeros.
En este ejercicio, completarás una función de transformación transform_avg_rating() que agrega los datos de calificación utilizando el método .groupby() del DataFrame de pandas. El objetivo es obtener un DataFrame con dos columnas, un id de curso y su valoración media:
| course_id | avg_rating |
|---|---|
| 123 | 4.72 |
| 111 | 4.62 |
| … | … |
En este ejercicio, completarás esta función de transformación y la aplicarás sobre los datos brutos de calificación extraídos mediante la función de ayuda extract_rating_data(), que extrae las calificaciones de los cursos de la tabla rating.
Este ejercicio forma parte del curso
Introducción a la ingeniería de datos
Instrucciones del ejercicio
- Completa la función
transform_avg_rating()agrupando por la columnacourse_id, y tomando la media de la columnarating. - Utiliza
extract_rating_data()para extraer los datos brutos de las valoraciones. Toma como argumento el motor de la base de datosdb_engines. - Utiliza
transform_avg_rating()en los datos de valoración brutos que has extraído.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Complete the transformation function
def transform_avg_rating(rating_data):
# Group by course_id and extract average rating per course
avg_rating = rating_data.____('____').rating.____()
# Return sorted average ratings per course
sort_rating = avg_rating.sort_values(ascending=False).reset_index()
return sort_rating
# Extract the rating data into a DataFrame
rating_data = extract_rating_data(____)
# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data)