1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Introduction to Data Engineering

Connected

Bài tập

Điểm trung bình theo khóa học

Một cách hay để gợi ý khóa học là giới thiệu những khóa có điểm đánh giá cao, vì học viên DataCamp thường thích các khóa được bạn học đánh giá tốt.

Trong bài tập này, bạn sẽ hoàn thiện hàm chuyển đổi transform_avg_rating() để tổng hợp dữ liệu đánh giá bằng phương thức .groupby() của DataFrame pandas. Mục tiêu là tạo ra một DataFrame với hai cột: id khóa học và điểm trung bình của khóa đó:

course_id avg_rating
123 4.72
111 4.62
… …

Trong bài tập này, bạn sẽ hoàn thiện hàm chuyển đổi này và áp dụng nó lên dữ liệu đánh giá thô được trích xuất thông qua hàm trợ giúp extract_rating_data() — hàm này trích xuất điểm đánh giá khóa học từ bảng rating.

Hướng dẫn

100 XP
  • Hoàn thiện hàm transform_avg_rating() bằng cách group theo cột course_id, và lấy giá trị trung bình của cột rating.
  • Dùng extract_rating_data() để trích xuất dữ liệu đánh giá thô. Hàm này nhận tham số là engine cơ sở dữ liệu db_engines.
  • Dùng transform_avg_rating() trên dữ liệu đánh giá thô mà bạn đã trích xuất.