1. 学ぶ
  2. /
  3. コース
  4. /
  5. spaCyで学ぶNatural Language Processing

Connected

演習

spaCy の Doc コンテナ

spaCy のテキスト処理パイプラインの最初のステップは、与えられた文字列を処理済みテキストを保持する Doc コンテナに変換することです。この演習では、spaCy モデルの読み込み、nlp() オブジェクトの作成、Doc コンテナの作成、そして用意された text 文字列の処理を練習します。

en_core_web_sm モデルはすでにダウンロード済みです。

指示

100 XP
  • en_core_web_sm を読み込み、nlp オブジェクトを作成します。
  • text 文字列から doc コンテナを作成します。
  • doc コンテナ内の各トークンのテキストを含むリストを作成します。