1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Unsupervised Learning bằng Python

Connected

Bài tập

Các đặc trưng NMF của các bài viết Wikipedia

Giờ bạn sẽ khám phá các đặc trưng NMF mà bạn đã tạo ở bài trước. Lời giải của bài trước đã được nạp sẵn, vì vậy mảng nmf_features đã sẵn có. Đồng thời có danh sách titles chứa tiêu đề của từng bài viết Wikipedia.

Khi khảo sát các đặc trưng, lưu ý rằng với cả hai diễn viên, đặc trưng NMF số 3 có giá trị cao nhất vượt trội. Điều này có nghĩa cả hai bài được tái tạo chủ yếu từ thành phần NMF thứ 3. Ở video tiếp theo, bạn sẽ thấy lý do: các thành phần NMF biểu diễn các chủ đề (ví dụ, diễn xuất!).

Hướng dẫn

100 XP
  • Import pandas với bí danh pd.
  • Tạo một DataFrame df từ nmf_features bằng pd.DataFrame(). Đặt chỉ mục thành titles bằng index=titles.
  • Dùng bộ truy cập .loc[] của df để chọn hàng có tiêu đề 'Anne Hathaway', rồi in kết quả. Đây là các đặc trưng NMF cho bài viết về nữ diễn viên Anne Hathaway.
  • Lặp lại bước cuối cho 'Denzel Washington' (một diễn viên khác).