1. 학습
  2. /
  3. 강의
  4. /
  5. PyTorch で学ぶテキストの Deep Learning

Connected

연습 문제

書籍タイトルのBag-of-Words

PyBooks では、今後の分析に向けてエンコードが必要な書籍タイトルのリストがあります。データチームは、Bag of Words(BoW)モデルが最適なアプローチになり得ると考えています。

次のパッケージはすでにインポートされています:torch、torchtext。

지침

100 XP
  • bag-of-words を実装するために CountVectorizer クラスをインポートします。
  • インポートしたクラスのオブジェクトを初期化し、そのオブジェクトを使って titles を行列表現に変換します。
  • get_feature_names_out() メソッドで最初の5つの特徴名とエンコード後のタイトルを抽出して表示します。