1. 학습
  2. /
  3. 강의
  4. /
  5. Unsupervised Learning bằng Python

Connected

연습 문제

Bài viết nào giống với 'Cristiano Ronaldo'?

Trong video, bạn đã học cách dùng đặc trưng NMF và cosine similarity để tìm các bài viết tương tự. Hãy áp dụng điều đó cho mô hình NMF của bạn với các bài viết Wikipedia phổ biến, bằng cách tìm các bài viết giống nhất với bài viết về cầu thủ bóng đá Cristiano Ronaldo. Các đặc trưng NMF bạn đã tính trước đó có trong nmf_features, còn titles là danh sách tiêu đề bài viết.

지침

100 XP
  • Import normalize từ sklearn.preprocessing.
  • Áp dụng hàm normalize() lên nmf_features. Lưu kết quả vào norm_features.
  • Tạo DataFrame df từ norm_features, dùng titles làm index.
  • Dùng bộ truy cập .loc[] của df để chọn hàng 'Cristiano Ronaldo'. Gán kết quả cho article.
  • Dùng phương thức .dot() của df với article để tính cosine similarity của mỗi hàng với article.
  • In kết quả phương thức .nlargest() của similarities để hiển thị các bài viết giống nhất. Phần này đã được làm sẵn, nên hãy bấm 'Gửi câu trả lời' để xem kết quả!