ComenzarEmpieza gratis

Valoración media por curso

Una forma estupenda de recomendar cursos es recomendar los mejor valorados, ya que a los alumnos de DataCamp suelen gustarles los cursos mejor valorados por sus compañeros.

En este ejercicio, completarás una función de transformación transform_avg_rating() que agrega los datos de calificación utilizando el método .groupby() del DataFrame de pandas. El objetivo es obtener un DataFrame con dos columnas, un id de curso y su valoración media:

course_id avg_rating
123 4.72
111 4.62

En este ejercicio, completarás esta función de transformación y la aplicarás sobre los datos brutos de calificación extraídos mediante la función de ayuda extract_rating_data(), que extrae las calificaciones de los cursos de la tabla rating.

Este ejercicio forma parte del curso

Introducción a la ingeniería de datos

Ver curso

Instrucciones de ejercicio

  • Completa la función transform_avg_rating() agrupando por la columna course_id, y tomando la media de la columna rating.
  • Utiliza extract_rating_data() para extraer los datos brutos de las valoraciones. Toma como argumento el motor de la base de datos db_engines.
  • Utiliza transform_avg_rating() en los datos de valoración brutos que has extraído.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Complete the transformation function
def transform_avg_rating(rating_data):
    # Group by course_id and extract average rating per course
    avg_rating = rating_data.____('____').rating.____()
    # Return sorted average ratings per course
    sort_rating = avg_rating.sort_values(ascending=False).reset_index()
    return sort_rating

# Extract the rating data into a DataFrame    
rating_data = extract_rating_data(____)

# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data) 
Editar y ejecutar código