1. Learn
  2. /
  3. Courses
  4. /
  5. Định hình lại dữ liệu với tidyr

Connected

Exercise

Và giải Oscar cho đạo diễn xuất sắc nhất thuộc về ... <NA>

Bạn đang làm việc với một mẫu dữ liệu Netflix đã được nạp sẵn là director_df. Lần này, data frame chỉ gồm các đạo diễn và tiêu đề phim. Mục tiêu của bạn là xác định những đạo diễn làm nhiều phim nhất. Vì cột director chứa nhiều tên, trước hết bạn sẽ tách các giá trị này thành nhiều hàng, rồi đếm số lần xuất hiện của từng đạo diễn.

Vì bạn không muốn các phim không có đạo diễn làm “bẩn” phần tổng quan, bạn sẽ dùng hàm drop_na().

Gói dplyr đã được nạp sẵn cho bạn.

Instructions 1/3

undefined XP
    1
    2
    3
  • Kiểm tra director_df trong console để xem chuỗi nào phân tách các đạo diễn trong cột director.
  • Trải các giá trị trong cột director thành các hàng riêng biệt.