ComeçarComece gratuitamente

Classificação média por curso

Uma ótima maneira de recomendar cursos é recomendar os cursos mais bem avaliados, pois os alunos da DataCamp geralmente gostam de cursos que são bem avaliados por seus colegas.

Neste exercício, você concluirá uma função de transformação transform_avg_rating() que agrega os dados de classificação usando o método .groupby() do DataFrame pandas. O objetivo é obter um DataFrame com duas colunas, um ID de curso e sua classificação média:

course_id avg_rating
123 4.72
111 4.62

Neste exercício, você concluirá essa função de transformação e a aplicará aos dados de classificação brutos extraídos por meio da função auxiliar extract_rating_data(), que extrai as classificações do curso da tabela rating.

Este exercício faz parte do curso

Introdução à engenharia de dados

Ver Curso

Instruções de exercício

  • Complete a função transform_avg_rating() agrupando pela coluna course_id e obtendo a média da coluna rating.
  • Use o site extract_rating_data() para extrair dados de classificações brutas. Ele recebe como argumento o mecanismo de banco de dados db_engines.
  • Use transform_avg_rating() nos dados brutos de classificação que você extraiu.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Complete the transformation function
def transform_avg_rating(rating_data):
    # Group by course_id and extract average rating per course
    avg_rating = rating_data.____('____').rating.____()
    # Return sorted average ratings per course
    sort_rating = avg_rating.sort_values(ascending=False).reset_index()
    return sort_rating

# Extract the rating data into a DataFrame    
rating_data = extract_rating_data(____)

# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data) 
Editar e executar código