Classificação média por curso
Uma ótima maneira de recomendar cursos é recomendar os cursos mais bem avaliados, pois os alunos da DataCamp geralmente gostam de cursos que são bem avaliados por seus colegas.
Neste exercício, você concluirá uma função de transformação transform_avg_rating()
que agrega os dados de classificação usando o método .groupby()
do DataFrame pandas
. O objetivo é obter um DataFrame com duas colunas, um ID de curso e sua classificação média:
course_id | avg_rating |
---|---|
123 | 4.72 |
111 | 4.62 |
… | … |
Neste exercício, você concluirá essa função de transformação e a aplicará aos dados de classificação brutos extraídos por meio da função auxiliar extract_rating_data()
, que extrai as classificações do curso da tabela rating
.
Este exercício faz parte do curso
Introdução à engenharia de dados
Instruções de exercício
- Complete a função
transform_avg_rating()
agrupando pela colunacourse_id
e obtendo a média da colunarating
. - Use o site
extract_rating_data()
para extrair dados de classificações brutas. Ele recebe como argumento o mecanismo de banco de dadosdb_engines
. - Use
transform_avg_rating()
nos dados brutos de classificação que você extraiu.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Complete the transformation function
def transform_avg_rating(rating_data):
# Group by course_id and extract average rating per course
avg_rating = rating_data.____('____').rating.____()
# Return sorted average ratings per course
sort_rating = avg_rating.sort_values(ascending=False).reset_index()
return sort_rating
# Extract the rating data into a DataFrame
rating_data = extract_rating_data(____)
# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data)