Valoración media por curso
Una forma estupenda de recomendar cursos es recomendar los mejor valorados, ya que a los alumnos de DataCamp suelen gustarles los cursos mejor valorados por sus compañeros.
En este ejercicio, completarás una función de transformación transform_avg_rating()
que agrega los datos de calificación utilizando el método .groupby()
del DataFrame de pandas
. El objetivo es obtener un DataFrame con dos columnas, un id de curso y su valoración media:
course_id | avg_rating |
---|---|
123 | 4.72 |
111 | 4.62 |
… | … |
En este ejercicio, completarás esta función de transformación y la aplicarás sobre los datos brutos de calificación extraídos mediante la función de ayuda extract_rating_data()
, que extrae las calificaciones de los cursos de la tabla rating
.
Este ejercicio forma parte del curso
Introducción a la ingeniería de datos
Instrucciones de ejercicio
- Completa la función
transform_avg_rating()
agrupando por la columnacourse_id
, y tomando la media de la columnarating
. - Utiliza
extract_rating_data()
para extraer los datos brutos de las valoraciones. Toma como argumento el motor de la base de datosdb_engines
. - Utiliza
transform_avg_rating()
en los datos de valoración brutos que has extraído.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Complete the transformation function
def transform_avg_rating(rating_data):
# Group by course_id and extract average rating per course
avg_rating = rating_data.____('____').rating.____()
# Return sorted average ratings per course
sort_rating = avg_rating.sort_values(ascending=False).reset_index()
return sort_rating
# Extract the rating data into a DataFrame
rating_data = extract_rating_data(____)
# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data)