1. Learn
  2. /
  3. Courses
  4. /
  5. spaCyで学ぶNatural Language Processing

Connected

Exercise

spaCy の語彙

単語ベクトル(word embeddings)は、テキストデータを使ってコンピュータが高度な処理を行えるようにする、単語の数値表現です。多くの spaCy モデルには単語ベクトルが含まれますが、含まれないモデルも一部あります。

この演習では、spaCy の語彙情報へのアクセスを練習します。単語ベクトルに関するメタ情報は各 spaCy モデルに保存されています。語彙サイズや単語ベクトルの次元数などの情報を取得して、詳細を確認できます。

spaCy パッケージはすでにインポートされています。spaCy モデルのメタデータでは、単語数は "vectors" キーの要素として、単語ベクトルの次元は "width" キーの要素として保存されています。

Instructions

100 XP
  • en_core_web_md モデルを読み込みます。
  • en_core_web_md モデルの語彙に含まれる単語数を出力します。
  • en_core_web_md モデルの単語ベクトルの次元数を出力します。