1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Bài tập

Dữ liệu ngầm định vs. dữ liệu tường minh

Như đã đề cập trong video bài tập, phản hồi dùng trong hệ thống gợi ý có thể là tường minh hoặc ngầm định.

Bộ dữ liệu listening_history_df đã được nạp sẵn cho bạn. Bộ dữ liệu này chứa các cột xác định người dùng, bài hát họ nghe, cùng với:

  • Skipped Track: Cột Boolean ghi nhận người dùng có bỏ qua bài hát hay nghe đến cuối.
  • Rating: Điểm người dùng chấm cho bài hát theo thang 10.

Trong bài tập này, bạn sẽ khám phá dữ liệu và từ đó xác định cột nào phản ánh rõ nhất phản hồi tường minh và phản hồi ngầm định.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Xem 5 hàng đầu của listening_history_df.
  • In ra số lượng giá trị duy nhất trong các cột Rating và Skipped Track.
  • Hiển thị biểu đồ tần suất (histogram) của các giá trị trong cột Rating.