1. 학습
  2. /
  3. 강의
  4. /
  5. Deep Learning cho Văn bản với PyTorch

Connected

연습 문제

Áp dụng TF-IDF cho mô tả sách

PyBooks đã thu thập một số mô tả sách và muốn xác định các từ quan trọng trong đó bằng kỹ thuật mã hóa TF-IDF. Bằng cách này, họ hy vọng hiểu rõ hơn về các thuộc tính độc đáo của từng cuốn sách để hỗ trợ hệ thống gợi ý sách.

Các gói sau đã được nhập sẵn cho bạn: torch, torchtext.

지침

100 XP
  • Import lớp TfidfVectorizer từ sklearn.feature_extraction.text, lớp này chuyển một tập hợp tài liệu thô thành ma trận các đặc trưng TF-IDF.
  • Khởi tạo một đối tượng của lớp này, sau đó dùng đối tượng đó để mã hóa descriptions thành một ma trận vector TF-IDF.
  • Lấy và hiển thị năm tên đặc trưng đầu tiên từ vectorizer và các vector đã mã hóa từ tfidf_encoded_descriptions.