1. 学ぶ
  2. /
  3. コース
  4. /
  5. PyTorch で学ぶテキストの Deep Learning

Connected

演習

シェイクスピア語の前処理パイプライン

PyBooks では、シェイクスピアの膨大なテキストデータを分析に向けて変換したいと考えています。これを最も効率よく行うには、前処理から始めるテキスト処理パイプラインを使うのが有効です。

次のモジュールは読み込まれています: torch, nltk, stopwords, PorterStemmer, get_tokenizer。

シェイクスピアのテキストデータは shakespeare に保存されており、文はすでに抽出されています。

指示1 / 3

undefined XP
    1
    2
    3
  • 英語のストップワードの一意なリストを作成し、stop_words に保存してください。