1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. PyTorch で学ぶテキストの Deep Learning

Connected

अभ्यास

書籍の説明文にTF-IDFを適用する

PyBooks は複数の書籍説明文を収集し、TF-IDF エンコーディング手法を使ってその中の重要語を特定したいと考えています。これにより、各書籍の特徴をより深く理解し、レコメンデーションシステムの改善につなげることを目指しています。

次のパッケージはすでにインポートされています: torch, torchtext.

निर्देश

100 XP
  • sklearn.feature_extraction.text から、原文ドキュメントの集合を TF-IDF 特徴量の行列に変換する TfidfVectorizer クラスをインポートします。
  • このクラスのオブジェクトを作成し、それを使って descriptions を TF-IDF のベクトル行列にエンコードします。
  • vectorizer から最初の5つの特徴量名を取得して表示し、tfidf_encoded_descriptions からエンコード済みのベクトルを表示します。