Avaliação média por curso
Uma ótima maneira de recomendar cursos é indicar os mais bem avaliados, já que estudantes da DataCamp geralmente gostam de cursos com avaliações altas feitas por seus colegas.
Neste exercício, você vai completar a função de transformação transform_avg_rating() que agrega os dados de avaliação usando o método .groupby() do DataFrame do pandas. O objetivo é obter um DataFrame com duas colunas: o id do curso e sua avaliação média:
| course_id | avg_rating |
|---|---|
| 123 | 4.72 |
| 111 | 4.62 |
| … | … |
Neste exercício, você vai completar essa função de transformação e aplicá-la aos dados brutos de avaliação extraídos pela função auxiliar extract_rating_data(), que extrai as avaliações de cursos da tabela rating.
Este exercício faz parte do curso
Introdução à Engenharia de Dados
Instruções do exercício
- Complete a função
transform_avg_rating()agrupando pela colunacourse_ide calculando a média da colunarating. - Use
extract_rating_data()para extrair os dados brutos de avaliações. Ela recebe como argumento o mecanismo de banco de dadosdb_engines. - Use
transform_avg_rating()nos dados brutos de avaliação que você extraiu.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Complete the transformation function
def transform_avg_rating(rating_data):
# Group by course_id and extract average rating per course
avg_rating = rating_data.____('____').rating.____()
# Return sorted average ratings per course
sort_rating = avg_rating.sort_values(ascending=False).reset_index()
return sort_rating
# Extract the rating data into a DataFrame
rating_data = extract_rating_data(____)
# Use transform_avg_rating on the extracted data and print results
avg_rating_data = transform_avg_rating(____)
print(avg_rating_data)